Logo Море(!) аналитической информации!
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware
Архив форумов ЦИТФорума
Море(!) вопросов - Море(!) ответов
 
 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 
Как правильно задавать вопросы

Посик и определение ключевых слов

 
Перейти:  
Этот форум закрыт, вы не можете писать новые сообщения и редактировать старые.   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов Архив форумов ЦИТФорума -> Программирование
Предыдущая тема :: Следующая тема  
Автор Сообщение
Strucka



Зарегистрирован: 15.09.2006
Сообщения: 4

СообщениеДобавлено: Пт Сен 15 2006 21:17    Заголовок сообщения: Посик и определение ключевых слов Ответить с цитатой

Вот так вот примерно можно обозвать.
Идей: есть текст ,положим нам надо определить ключевые слова данного тектса.
Что это за слова? Они должны определять некую тематику документа.
К примеру в тексте говорится о парниковом эффекте. Возможны ключевые слова - испарение , лед , СО2 . океан и тд
Как можно выявить такие слова, если при банальном подсчете частоты встречаемости самое распротранненое - предлоги и тд...

Задача: определить математическую формулу(о как) которая может определить с какой -то долей вероятности будет ли данное слово ключевым или нет. При этом проверки накладываемые на "верность ключа" надо придумать свои.

Если у кого-нибудь есть какие-то варианты хотя бы части этой формулы или какие-то идеи по накладываемым проверкам и алгоритму их реализации просю делиться.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Kefir



Зарегистрирован: 16.04.2005
Сообщения: 443
Откуда: Пермь

СообщениеДобавлено: Пн Сен 18 2006 08:24    Заголовок сообщения: Ответить с цитатой

Есть словари частоты встречаемости слов. Я качал такой словарь с сайта какого-то института ИИ (гугл Вам в помощь) . Очевидно, что если слово в тексте встречается заметно чаще, чем это указано в словаре, то это слово является ключевым. Если слова вообще нет в словаре, то скорее всего либо это слово с ошибкой, либо ключевое.
_________________
Самоловских Виталий aka Kefir
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
Kefir



Зарегистрирован: 16.04.2005
Сообщения: 443
Откуда: Пермь

СообщениеДобавлено: Пн Сен 18 2006 08:26    Заголовок сообщения: Ответить с цитатой

Да, совссем забыл, Вам нужно еще почитать про алгоритмы выделения основы слова.
_________________
Самоловских Виталий aka Kefir
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail
Показать сообщения:   
Этот форум закрыт, вы не можете писать новые сообщения и редактировать старые.   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов Архив форумов ЦИТФорума -> Программирование Часовой пояс: GMT + 3
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2002 phpBB Group
Русская поддержка phpBB

 

IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Информация для рекламодателей PR-акции, размещение рекламы — adv@citforum.ru,
тел. +7 495 6608306, ICQ 232284597
Пресс-релизы — pr@citforum.ru
Послать комментарий
Информация для авторов
This Web server launched on February 24, 1997
Copyright © 1997-2000 CIT, © 2001-2006 CIT Forum
Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...