Logo Море(!) аналитической информации!
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware
Архив форумов ЦИТФорума
Море(!) вопросов - Море(!) ответов
 
 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 
Как правильно задавать вопросы

разбор html

 
Перейти:  
Этот форум закрыт, вы не можете писать новые сообщения и редактировать старые.   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов Архив форумов ЦИТФорума -> Программирование
Предыдущая тема :: Следующая тема  
Автор Сообщение
sorg



Зарегистрирован: 19.12.2006
Сообщения: 2

СообщениеДобавлено: Вт Дек 19 2006 14:01    Заголовок сообщения: разбор html Ответить с цитатой

скажите, вот есть рабочая процедура выдирания со страницы гугла результатов. Как бы переделать на яндекс?
Код:

sub google {
local($url, $title, $text);
local($request) = $_[0];
local $data = http_get("www.google.com", "/search?filter=0&hl=ru&num=1&start=0&q=".url_encode($request), 1);
if(($url, $title, $text) = $data =~ /<h2 class=r><a class=l href=\"([^\"]+)\">(.+)<table border=0 cellpadding=0 cellspacing=0><tr><td class=j><font size=-1>(.+)<br><span class=a>/) {
$title = html_decode($conv->convert($title)); $text = html_decode($conv->convert($text));
if($title =~ /^(.+) \- \[ [^\]]+ \]$/){ $title = $1; }
return "$title: $text [$url]"; }
else { return "ФИГУШКИ, НЕМА НИЧ0"; }
 }
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Kefir



Зарегистрирован: 16.04.2005
Сообщения: 443
Откуда: Пермь

СообщениеДобавлено: Вт Дек 19 2006 14:30    Заголовок сообщения: Ответить с цитатой

http://xml.yandex.ru/
_________________
Самоловских Виталий aka Kefir
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
sorg



Зарегистрирован: 19.12.2006
Сообщения: 2

СообщениеДобавлено: Вт Дек 19 2006 16:02    Заголовок сообщения: Ответить с цитатой

а аща варианты есть?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
witeX



Зарегистрирован: 27.06.2005
Сообщения: 33

СообщениеДобавлено: Вт Дек 19 2006 17:04    Заголовок сообщения: Ответить с цитатой

Что,что делать?
Парсить самому!
Я было дела парсил.. по работе задание давали!
Но счас уже исходников не осталось!
Учи регулярные выражения и вперёд!
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Kefir



Зарегистрирован: 16.04.2005
Сообщения: 443
Откуда: Пермь

СообщениеДобавлено: Ср Дек 20 2006 13:33    Заголовок сообщения: Ответить с цитатой

Расскажу историю из жизни простых Разработчиков Центра Дистанционного Обучения при Пермском Государственном Университете (РЦДО ПГУ), которая произошла, когда я там еще работал.

Разрабатывали мы "Областной банк педагогической информации" (ОБПИ), который должен был предоставлять доступ к различным документам. Поставлять документы нам должна была сторонняя организация, которая получив деньги это простое задание успешно провалила. Но Мы не отчаивались было принято решение тащить законодательные акты с какого-то федерального сервера, один хрен они в свободном доступе. Естественно, специализированного интерфейса для этого не было, поэтому один из наших программистов занимался парсингом HTML. Все бы хорошо, тока ему приходилось шаблон раз в 2 недели переписывать, т.к. менялся сайт с которого мы тянули документы.

Короче - затея гнилая... Ниче хорошего из этого не выйдет. Если есть специализированный интерфейс используйте его.
_________________
Самоловских Виталий aka Kefir
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
Показать сообщения:   
Этот форум закрыт, вы не можете писать новые сообщения и редактировать старые.   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов Архив форумов ЦИТФорума -> Программирование Часовой пояс: GMT + 3
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2002 phpBB Group
Русская поддержка phpBB

 

IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Информация для рекламодателей PR-акции, размещение рекламы — adv@citforum.ru,
тел. +7 495 6608306, ICQ 232284597
Пресс-релизы — pr@citforum.ru
Послать комментарий
Информация для авторов
This Web server launched on February 24, 1997
Copyright © 1997-2000 CIT, © 2001-2006 CIT Forum
Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...