Архив Май 2012

Вычистить текст от тегов MS Word

Внезапно случается, что когда текст вносится напрямую из Word в WYSWYG-редактор — получается плохо. Чтобы не переделывать руками каждую запись через админку, было принято решение переделать все через консоль. В итоге: <? if(!mysql_connect('host', 'user', 'password')){     die(mysql_error()); } if(!mysql_select_db('db')){     die(mysql_error()); } mysql_query("SET NAMES UTF8"); $tables = array(                 'news'  =>  array(                                 'id'        => 'id',                                 'content'   => 'content_field'                             ),                 'pages' =>  array(                                 'id'        =>  'page_id',                                 'content'   => 'content_field'                 )             ); $mask = array('mso', '\"'); foreach($tables as $table=>$data){          foreach($mask as $mask_value){         echo "Searching ".$mask_value."\n";         $query = "SELECT COUNT(*) FROM ".$table." WHERE ".$data['content']." LIKE '%".$mask_value."%'"; […]

Логин и парсер Яндекс.Вебмастера

Волею судеб захотелось отфильтровать в одном дампе индексат от неиндексата — полез в Яндекс.Вебмастер. Ну, сразу перейду к расстройству что даже в Я.Вебмастер показывается только первая 1000 проиндексированных страниц — но парсер уже был готов, допиливать его не стал. С использованием Jum::Web::Crawler — функцию под него я уже постил use strict; use Jum::Web::Crawler; my $login […]