Библиотека Интернет Индустрии I2R.ru |
|||
|
Поиск информации внутри звуковых файлов28.05.2004 18:39 Большинство поисковых пауков, которые бороздят Сеть и поставляют материал для составления поискового индекса, остаются <слепыми> и <глухими> по отношению к видео- и аудиоконтенту. Если поиск по рисункам Тем временем интерес пользователей к мультимедийному контенту постоянно возрастает по мере того как стремительно увеличивается количество широкополосных подключений к интернету. Мультимедийный контент становится все более востребованным, но пользователи не могут его найти, потому что поисковые сайты неспособны индексировать текст внутри мультимедийных файлов, хотя такие технологии существуют. Дошло до того, что уже сами производители мультимедийного контента начали подстраиваться под требования современных поисковых машин. Если Google пока не может автоматически распознавать текст в аудиозаписях, то приходится делать это самостоятельно. Например, одна из крупнейших в Америке радиостанций NPR начала выкладывать на своем сайте текстовую расшифровку всех репортажей и выпусков новостей, которые выходят в эфир. Расшифровка производится в реальном режиме времени с помощью специального ПО для распознавания речи от компании StreamSage. Теперь сайт радиостанции, наконец, начал появляться среди результатов поиска Google и Yahoo!. А Google даже сделала NPR специальное предложение по включению аудиозаписей в некий <мультимедийный> раздел поиска, который еще даже официально не объявлен. Софт StreamSage индексирует содержимое мультимедийных файлов, при этом он может выполнять несколько задач: определение языка, распознавание речи и выделение ключевых слов. Кстати, несколько дней назад компания открыла специальный сайт CampaignSearch.com для демонстрации своих передовых технологий. Данный сервис осуществляет поиск в интернете аудио- и видеофайлов на предвыборную тематику. Уникальная особенность - поиск внутри этих файлов, когда, например, в часовой речи Джона Керри можно найти четырехминутный фрагмент, посвященный здравоохранению. По информации компании StreamSage, ее технологии успешно используются в Гарвардском университете, где Впрочем, надежное распознавание речи в мультимедийных файлах пока в будущем. А сейчас крупнейшим в интернете сайтом по поиску аудио- и видеоконтента является более примитивный Singingfish, который не распознает речь, а использует тэги. Поисковый индекс Singingfish содержит описания более 9 млн потоковых мультимедийных файлов (валидность ссылок около 99%), и каждый день база данных увеличивается примерно на 80 тыс. Для включения файла в индекс требуется создать для него до 70 текстовых полей описания - это автор, Полнотекстовый поиск по мультимедийным файлам - очень перспективная технология, над которой работают множество фирм. Например, технологию Speechbot разрабатывает НР. Над этими же проблемами работают компании Nexidia и Virage, которая сейчас является собственностью Autonomy, а также такие гиганты как Yahoo! и AOL. Например, Yahoo! Приобрела компанию AltaVista, которая в свое время одной из первых разработала механизм для поиска аудио- и видеофайлов в интернете. AOL также не осталась в стороне и недавно приобрела компанию Singingfish. Что ж, теперь слово за Google. последние новости 07.04.2006 15:57 | Сформирована программа КИБа...» 07.04.2006 14:27 | MixMarket.BIZ вводит рейтинг площадок...» 06.04.2006 15:30 | Ученье – свет, а неученье - …...» 06.04.2006 14:53 | II Международная конференция "Интернет-маркетинг в Украине. Опубликована предварительная программа конференции...» 05.04.2006 21:06 | Google и «Яндекс» контролируют поиск изображений...» 05.04.2006 19:37 | Стартовал конкурс "Звёзды Татнета-2006"...» 05.04.2006 19:20 | "Близкие ссылки" — новый сервис Google для сайтов...» 04.04.2006 12:23 | РА "Артон консалтинг" проводит практический семинар "Эффективная реклама в Интернете"...» 01.04.2006 17:50 | "Британика" купила Библиотеку Сайтостроительства ...» 31.03.2006 15:16 | Компания Eset выпустила новую версию антивирусного ПО NOD32 для серверов Linux...» 30.03.2006 17:49 | Сайтовладелец как козел отпущения...» 30.03.2006 17:21 | Самые дорогие слова в AdWords, «Директе» и «Бегуне»...» 30.03.2006 15:47 | Создатель Jabber работает над системой идентификации контента...» 29.03.2006 18:22 | Google разрабатывает новый интерфейс для поисковика...» 29.03.2006 18:14 | Суточная аудитория рунета увеличилась на 29 процентов...» 29.03.2006 16:16 | Photoshop CS2 на кончиках пальцев. Виртуозная техника...» 29.03.2006 00:24 | Microsoft готовит инструменты для Ajax-программирования...» 29.03.2006 00:06 | AjaxWrite: онлайновый аналог MS Word...» 28.03.2006 23:50 | Этот одноразовый РИФ...» 28.03.2006 23:44 | РИФ 2006, день третий. Удовлетворение синтетических потребностей в убийстве традиционных СМИ...» |
|
2000-2008 г. Все авторские права соблюдены. |
|