Logo Море(!) аналитической информации!
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware
Архив форумов ЦИТФорума
Море(!) вопросов - Море(!) ответов
 
 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 
Как правильно задавать вопросы

Формула определяющие уникальность слова.

 
Перейти:  
Этот форум закрыт, вы не можете писать новые сообщения и редактировать старые.   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов Архив форумов ЦИТФорума -> Математика
Предыдущая тема :: Следующая тема  
Автор Сообщение
Strucka



Зарегистрирован: 15.09.2006
Сообщения: 4

СообщениеДобавлено: Пт Сен 15 2006 21:12    Заголовок сообщения: Формула определяющие уникальность слова. Ответить с цитатой

Вот так вот примерно можно обозвать.
Идей: есть текст ,положим нам надо определить ключевые слова данного тектса.
Что это за слова? Они должны определять некую тематику документа.
К примеру в тексте говорится о парниковом эффекте. Возможны ключевые слова - испарение , лед , СО2 . океан и тд
Как можно выявить такие слова, если при банальном подсчете частоты встречаемости самое распротранненое - предлоги и тд...

Задача: определить математическую формулу(о как) которая может определить с какой -то долей вероятности будет ли данное слово ключевым или нет. При этом проверки накладываемые на "верность ключа" надо придумать свои.

Если у кого-нибудь есть какие-то варианты хотя бы части этой формулы или какие-то идеи просю делиться.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
grf



Зарегистрирован: 05.04.2005
Сообщения: 1242
Откуда: Москва

СообщениеДобавлено: Пн Сен 18 2006 10:03    Заголовок сообщения: Ответить с цитатой

А получить сжатый пересказ, резюме или основные выводы из вложенного текста не надо??? Laughing

Я вижу 2 варианта простой и сложный
1. Простой найти существительное, которое встречается в тексте чаще всего и дополнить его чаще всего встречающимся прилагательным Laughing

2. Создать базу тем, и набор ключевых слов для каждой темы, далее стсистика вхождений ключевых слов по разным темам в тексте и определение на ее основе принадлежность текста к определенной тематике.
наверняка тебя не интересуют все тексты в мире, а определенные докуенты в определенной сфере деятельности.
Wink
_________________
Errare humanum est
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
критикан



Зарегистрирован: 18.02.2005
Сообщения: 247

СообщениеДобавлено: Пт Апр 20 2007 17:46    Заголовок сообщения: Кого давить, если перед машиной молодуха и старуха? Тормоз! Ответить с цитатой

Интересно, а сколько раз слово "закон" или "Центральный Банк" встречаются в законах, изданных Центральным Банком? А вы "ключевые слова"!
------------------------
Кого нужно давить, если в аварийной ситуации перед машиной оказались молодуха и старуха? -- Тормоз нужно давить!
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
grf



Зарегистрирован: 05.04.2005
Сообщения: 1242
Откуда: Москва

СообщениеДобавлено: Пн Апр 23 2007 08:55    Заголовок сообщения: Ответить с цитатой

да нет, ключевое слово и тема далеко не всегда совпадают

так к теме банк, одним из слов может быть процентная ставка


Wink
_________________
Errare humanum est
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Этот форум закрыт, вы не можете писать новые сообщения и редактировать старые.   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов Архив форумов ЦИТФорума -> Математика Часовой пояс: GMT + 3
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2002 phpBB Group
Русская поддержка phpBB

 

IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

Информация для рекламодателей PR-акции, размещение рекламы — adv@citforum.ru,
тел. +7 495 6608306, ICQ 232284597
Пресс-релизы — pr@citforum.ru
Послать комментарий
Информация для авторов
This Web server launched on February 24, 1997
Copyright © 1997-2000 CIT, © 2001-2006 CIT Forum
Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...