Предыдущая тема :: Следующая тема |
Автор |
Сообщение |
sorg
Зарегистрирован: 19.12.2006 Сообщения: 2
|
Добавлено: Вт Дек 19 2006 14:01 Заголовок сообщения: разбор html |
|
|
скажите, вот есть рабочая процедура выдирания со страницы гугла результатов. Как бы переделать на яндекс?
Код: |
sub google {
local($url, $title, $text);
local($request) = $_[0];
local $data = http_get("www.google.com", "/search?filter=0&hl=ru&num=1&start=0&q=".url_encode($request), 1);
if(($url, $title, $text) = $data =~ /<h2 class=r><a class=l href=\"([^\"]+)\">(.+)<table border=0 cellpadding=0 cellspacing=0><tr><td class=j><font size=-1>(.+)<br><span class=a>/) {
$title = html_decode($conv->convert($title)); $text = html_decode($conv->convert($text));
if($title =~ /^(.+) \- \[ [^\]]+ \]$/){ $title = $1; }
return "$title: $text [$url]"; }
else { return "ФИГУШКИ, НЕМА НИЧ0"; }
}
|
|
|
Вернуться к началу |
|
|
Kefir
Зарегистрирован: 16.04.2005 Сообщения: 443 Откуда: Пермь
|
Добавлено: Вт Дек 19 2006 14:30 Заголовок сообщения: |
|
|
http://xml.yandex.ru/ _________________ Самоловских Виталий aka Kefir |
|
Вернуться к началу |
|
|
sorg
Зарегистрирован: 19.12.2006 Сообщения: 2
|
Добавлено: Вт Дек 19 2006 16:02 Заголовок сообщения: |
|
|
а аща варианты есть? |
|
Вернуться к началу |
|
|
witeX
Зарегистрирован: 27.06.2005 Сообщения: 33
|
Добавлено: Вт Дек 19 2006 17:04 Заголовок сообщения: |
|
|
Что,что делать?
Парсить самому!
Я было дела парсил.. по работе задание давали!
Но счас уже исходников не осталось!
Учи регулярные выражения и вперёд! |
|
Вернуться к началу |
|
|
Kefir
Зарегистрирован: 16.04.2005 Сообщения: 443 Откуда: Пермь
|
Добавлено: Ср Дек 20 2006 13:33 Заголовок сообщения: |
|
|
Расскажу историю из жизни простых Разработчиков Центра Дистанционного Обучения при Пермском Государственном Университете (РЦДО ПГУ), которая произошла, когда я там еще работал.
Разрабатывали мы "Областной банк педагогической информации" (ОБПИ), который должен был предоставлять доступ к различным документам. Поставлять документы нам должна была сторонняя организация, которая получив деньги это простое задание успешно провалила. Но Мы не отчаивались было принято решение тащить законодательные акты с какого-то федерального сервера, один хрен они в свободном доступе. Естественно, специализированного интерфейса для этого не было, поэтому один из наших программистов занимался парсингом HTML. Все бы хорошо, тока ему приходилось шаблон раз в 2 недели переписывать, т.к. менялся сайт с которого мы тянули документы.
Короче - затея гнилая... Ниче хорошего из этого не выйдет. Если есть специализированный интерфейс используйте его. _________________ Самоловских Виталий aka Kefir |
|
Вернуться к началу |
|
|
|