2 мая 2012, 17:48
Волею судеб захотелось отфильтровать в одном дампе индексат от неиндексата — полез в Яндекс.Вебмастер. Ну, сразу перейду к расстройству что даже в Я.Вебмастер показывается только первая 1000 проиндексированных страниц — но парсер уже был готов, допиливать его не стал.
28 мая 2011, 10:43
http://devconf.ru Буду дебютировать в роли докладчика на Perl-секции — http://devconf.ru/offers/24 , в 18-00, закрывая секцию. «Концепция алгоритма построения стабильного многопоточного приложения которое обрабатывает слова, нормализуя их с помощью инструмента от Яндекса — mystem.»
16 декабря 2010, 13:50
Самый оптимальный способ вывести два больших файла «рядом» Предположим, что есть два файла 1.txt cодержит: 1 2 3 4 5 2.txt содержит 6 7 8 9 0 Надо вывести запись из файла 2.txt рядом с записью 1.txt perl -le 'open F,"<$ARGV[0]";while (<STDIN>){chomp;print «$_\t».readline (*F);}close F;' 2.txt<1.txt
3 августа 2010, 10:15
А знаете ли вы о том, что в Perl6 можно будет сделать так: «perl -le 'say q[Hello];'» ? А можно будет сделать и так: «perl -le 'q[Hello].say;'» Это — апофеоз.
11 июня 2010, 10:08
В жизни каждого программиста наступает момент, когда ему надо выцепить кусок текста, независимо от регистра — но в контексте зависимого от регистра текста. На помощь приходят локальные модификаторы — например, — в пределах кластера это будет так: — bash-3.2$ perl -le 'my $x = «Abc»; print «ok» if $x =~ /(?i:a) b/;' ok — bash-3.2$ perl -le 'my […]
1 июня 2010, 15:21
Когда нормализуешь слова с помощью mystem — лучше использовать bidirectional pipe, вместо того, чтобы каждый раз открывать новый процесс. Это очень просто. Учитывая долбанутость mystem, мы будем отбрасывать слова с цифрами и ждать подольше. На всякий там. Пробелы он превращает в _, так что триггеры обоснованы.
9 апреля 2010, 15:21
Суть проста — выгрести из Армори последние ачивы, проверить — не постили ли раньше, запостить в ЖЖ. Накидалось на коленке, я использую БД в расширенной версии скрипта — но решил и такой мелкий написать :) UPD — чёт ппц криво получился этот сниппет в опубликованном виде. Аттачу ссылку на оригинал. Plain-Text
26 марта 2010, 12:46
Задача — из 001e8c15ffbc сделать 00:1e:8c:15:ff:bc Решение — perl -le 'my $x = «001e8c15ffbc»;$x =~ s/(...(?!\Z))/\1:/g; print $x' Разберем по кусочкам этот примитив. (...(?!\Z))/\1: ... — два любых символа (можно написать длиннее, если сомневаемся, что к нам придёт именно мак) — например, [a-f\d]{2} (?!\Z) — заглянем вперёд — нет ли там конца строки. Если есть — не попадаем в условие и, соответственно, […]
23 марта 2010, 12:48
Удаляем все элементы, которые не цифры. Работаем с референсом. #!/usr/bin/perl use strict; use Data::Dumper; my $a = [234235,'a',345,34234,23121]; $a = [grep {/^\d+$/ } @$a]; print Dumper $a; UPD Rommeech заметил багу, исправил
12 марта 2010, 13:37
Собственно, уже не мудрствуя лукаво — кто хоть немного знает перл — разберётся. Вконтакте добавили редиректики, что не помешает доблестному Curl через них пройти и получить куку в файл. #!/usr/bin/perl -w use strict; use WWW::Curl::Easy; use Carp;