Распознавание голоса: первые шаги в массовом бизнесе

Старая идея заставить технику научиться распознавать человеческий голос, кажется, начинает воплощаться. По оценкам экспертов, рынок подобных решений в 2002 году достиг 695 млн. долл., что на 10% выше показателей предыдущего, 2001 года. Примечательно, что отечественные компании также завоевали место на этом рынке и с успехом теснят своих заокеанских конкурентов-разработчиков. Программа Speereo™ Voice Organizer небольшой санкт-петербургской фирмы номинирована как лучший речевой продукт 2002 г. авторитетным американским журналом Pocket PC Magazine — впервые было достигнуто качество распознавания речи, которое оценивается в 99,9%… В свое время компания Lernout&Hauspie разработала неплохую технологию распознавания голоса под названием Dragon. Однако в 2000 г. компанию постигло банкротство, и после громкого скандала технология Dragon в 2001 г. была продана компании ScanSoft. Затем последовали попытки использовать программу распознавания голоса в коммерческих целях: пробовали продавать голосовую рекламу по телефону. Однако дело не пошло.

И вот теперь технология распознавания голоса обретает новое поприще. Множество компаний используют ее для снижения издержек и увеличения эффективности своего бизнеса. И речь идет не только о голосовом наборе текста вместо клавиатуры.

Вот несколько примеров использования этой технологии в США.

Риэлтеры часто обращаются к услугам компании Newport Wireless. Когда они проезжают на машине по улице и видят возле какого-нибудь дома табличку «Продается», они звонят в Newport Wireless и запрашивают сведения о доме с таким-то номером, находящемся по такой-то улице. Автоответчик приятным женским голосом рассказывает им о метраже дома, дате постройки и владельцах. Вся эта информация находится в базе данных Newport Wireless. Риэлтерам остается только выдать сообщение клиенту. Абонентская плата — около $30 в месяц.

Джули, виртуальный агент компании Amtrak, обслуживает железнодорожных пассажиров с октября 2001 г. Она сообщает по телефону о расписании поездов, об их прибытии и отправлении, а также производит бронирование билетов. Руководство Amtrak надеется, что Джули в мае возьмет на себя также и продажу билетов по кредитным картам. Джули — это продукт компании SpeechWorks Software и Intervoice Hardware. Она уже увеличила показатель удовлетворенности пассажиров на 45%, и вот уже тринадцать из пятидесяти клиентов получают всю нужную информациюиз «уст» Джули, прежде чем начать названивать в билетную кассу. Раньше компания Amtrak использовала тоновую систему справки, однако показатель удовлетворенности был тогда меньше: всего девять клиентов из пятидесяти.

В Amtrak признаются, что свою цену ($4 млн.) Джули окупила за двенадцать-восемнадцать месяцев. Она позволила не нанимать на работу целую команду настоящих агентов. В это же время British Airways экономит полтора миллиона долларов в год, используя технологию от Nuance Communications, которая тоже автоматизирует справочную службу.

Недавно Sony Computer Entertainment America представила на рынке Socom: первую видеоигру, в которой игроки могут отдавать устные приказы бойцам из «Deploy grenades». Игра стоит $60. В ней использована технология ScanSoft. В прошлом году было продано 450000 таких игр, что сделало Socom безусловным лидером продаж компании.

В дорогих автомобилях от Infinity и Jaguar уже несколько лет используется устный контроль за панелью управления: радио, температурный режим и навигационная система понимают голос владельца машины и беспрекословно слушаются хозяина. Но сейчас технология распознавания голоса начинает использоваться и в машинах среднего класса. Так, в 2003 г. Honda Accord будет иметь встроенный голосовой определитель от IBM. Он называется ViaVoice и является частью навигационной системы за $2000. По сообщению компании-поставщика, одна пятая часть покупателей Honda Accord остановила свой выбор на модели с голосовой системой навигации.

Даже в медицине технология распознавания голоса находит себе место. Уже разработаны аппараты осмотра желудка, послушные голосу врача. Правда, эти аппараты, по словам специалистов, пока еще не совершенны, у них замедленная реакция на приказы врача. Однако, все еще впереди.

В Мемфисе VA Medical Center вложил $277 тыс. в программу Dragon, позволяющую врачам и медсестрам надиктовывать информацию в базу данных компьютера. Вероятно, скоро многие позабудут, что такое «медицинский почерк» в карте болезни.

Уже сотни крупных компаний используют технологию распознавания голоса в своей продукции или услугах. Среди них AOL, FedEx, Honda, Sony, Sprint, T. Rowe Price, United Airlines и Verizo. По оценкам экспертов, рынок голосовой технологии в 2002 г. достиг порядка $695 млн., что на 10% выше предыдущего, 2001 г.

Примечательно, что отечественные компании также завоевали место на этом рынке и с успехом теснят своих заокеанских конкурентов-разработчиков. Так, программа Speereo™ Voice Organizer санкт-петербургской фирмы «Титан Информационный Сервис» номинирована как лучший речевой продукт 2002 г. авторитетным американским журналом Pocket PC Magazine. В том же, 2002 г. компания участвовала в III Российской венчурной ярмарке.

Столь значительных успехов петербургской фирме позволили добиться отечественные программисты-математики. В разработках и созданных на их основе продуктах использует ряд оригинальных алгоритмов, основанных на сложных математических моделях. Примечательно, что некоторые из ее продуктов уже обеспечивают обратный перевод с голоса, то есть распознавание не только английских фраз, а достигнутое качество распознавания речи оценивается в 99,9%.

По материалам сервера: C-News.ru

Компьютерная программа определяет потенциальные музыкальные хиты

Испанская компания Polyphonic HMI разработала компьютерную программу, позволяющую отбирать потенциальные музыкальные хиты. Используя подобный инструмент, звукозаписывающие компании могут предсказывать коммерческий успех того или иного исполнителя, той или иной композиции… Разработанная компанией программа Hit Song Science анализирует такие параметры музыкальной записи, как тембр, темп, сочетания нот в мелодии и т.п. Полученный музыкальный портрет сравниваются с информацией о других композициях, уже выпущенных звукозаписывающими компаниями на рынок. При этом появляется возможность проверить, насколько новые записи соответствуют современным тенденциям в музыке и вкусам потребителей.
Хиты музыкальных продаж, как правило, имеют схожие характеристики, например, в Polyphonic установили, что композиции Beatles и Элвиса Пресли имеют целый ряд общих черт. По их мнению, это позволяет эффективно предсказывать успех новых исполнителей. Тестирование системы проводилось компанией на основе обширной коллекции из 250000 альбомов, что позволило разработать метод достоверного определения рыночного потенциала композиций.
В качестве критериев успеха той или иной композиции обозначаются объемы проданных тиражей дисков и места, занятые хитами в различных чартах. База данных постоянно пополняется информацией о новых музыкальных релизах, с тем чтобы алгоритмы предсказаний работали с максимальной эффективностью. Помимо определения перспектив той или иной записи, технология может использоваться в музыкальных магазинах для помощи покупателям в подборе музыки сходного характера, составления плейлистов и решения множества других задач.

По материалам сервера: COMPULENTA.ru

Apple возрождает дух Napster

Пять руководителей ведущих звукозаписывающих компаний окончательно утвердились во мнении, что музыкальные онлайн службы могут приносить им прибыль. Однако данные сервисы в ближайшее время будут доступны только пользователям Макинтошей… По некоторым данным новый проект уже разработан Apple и позволит пользователям «яблочных» компьютеров и портативных плееров iPod все тоже самое, что и многие другие сервисы, например Napster, которые этими же звукозаписывающими компаниями и были прикрыты. Убедило медиа-мастодонтов всего дав фактора: сервис будет платный и чрезвычайно доступный и понятный. «Это именно то, что так ждала музыкальная индустрия все эти года», сказал человек, занимающийся переговорами между Apple и студиями. «Это удобно. Это быстро. Это легко. Если пользователь заинтересован в покупке музыки, а не только ее воровстве в Интернете, то это лучшее решение для него».
Медиа-магнатов тоже можно понять. Никому не секрет, что обмен файлами mp3 достиг в Сети глобальных масштабов и не обращать внимание на это просто нельзя. Закрытие подобных сервисов — не панацея, ибо на один закрытый приходится два, а то и три новых. Таким образом, сервис от Apple послужит отличной альтернативой, хорошим прецедентом и отличным антипиратским лекарством.
Музыкальный сервис от Apple будет выгодно отличаться от других подобных проектов, которые уже не раз рассматривались компаниями, своей «прозрачностью» и ценовой политикой. Предшественники имели громоздкую конструкцию, использование которой значительно затрудняло процесс покупки и закачки песен, и завышенные цены, что объяснялось сложностью создания системы безопасности, которая бы свела попытки незаконного копирования на нет. Очевидно, из этого вытекает ответ на вопрос: почему только пользователи Макинтошей смогут пользоваться службой — да просто потому, что ее на порядок сложнее будет обхитрить или «сломать».
Несмотря на то, что пока никаких подробностей оглашено не было, стало известно, что четыре из пяти ведущих компаний уже согласилось представить Apple свои продукты, а сам сервис, вполне вероятно, будет запущен уже в апреле, сообщает Deep Apple.
Не менее выгоден и данный сервис самой Apple, которая не скрывает свое намерение увеличить долю своего присутствия на рынке почти в два раза. Однако, зная любовь Джобса делать сюрпризы, можно и не ждать того, что он расскажет о подобных планах заранее. Что и происходит.
Сервис станет доступен одновременно с выходом новой версии iTunes, который уже не за горами. Теперь пользователь сможет не только прослушивать песни в этой программе, но и легко просматривать доступные файлы на сервере, одним нажатием мышки покупать их и закачивать к себе на компьютер или iPod. Затем эти файлы можно записать на CD. Последний пункт, кстати, вызвал самые жаркие дебаты. Студии сначала предлагали ограничить использование файлов одним компьютером или плеером, но Джобсу удалось сломить сопротивление всех, кроме представителей Sony, которые пока еще окончательно не решились на такой шаг.
Ну и самая щекотливая сторона — финансовая. Еще не известно точно, сколько будет стоить эта служба пользователям, но ориентировочно, цена одной песни составляет 99 центов или 10 долларов в месяц для неограниченного количества файлов. В любом случае, тайной это останется недолго.

По материалам сервера: PROext.com

Прикольный мультик

Вот такой прикольный мультик на флеше прислал нам Muxa, за что ему большое человеческое спасибо! =)
Для просмотра, кликните ниже по ссылке «Подробнее» (при загрузке этого мультика возможны небольшие тормоза)… Для полноценного восприятия, не забудьте включить звук.

Интернет кафе оштрафованы за MP3

Конфликт, полтора года тянувшийся между Английской ассоциацией звукозаписи (British Phonographic Industry, BPI), среди членов которой присутствуют такие крупные лейблы, как Sony, Universal и EMI, и компанией EasyInternet, владеющей одноименной сетью Интернет-кафе, закончился для последней полным поражением… Верховный суд Великобритании признал ее виновной в нарушении авторских прав и в ближайшее время вынесет решение о сумме компенсационных выплат. Ранее, до суда, BPI требовала 1 млн. фунтов стерлингов (1,6 млн. долларов США), но в EasyInternet называют это вымогательством. По данному поводу группа сотрудников компании даже устроила демонстрацию перед зданием Верховного суда Соединенного Королевства.

Причиной иска BPI послужил тот факт, что в заведениях EasyInternet посетители могли всего за 5 фунтов стерлингов ($8) записать на компакт-диск любые файлы, загруженные ими из Интернета. При этом правила работы в кафе формально запрещали копирование музыки в формате MP3, но реально такая возможность клиентам предоставлялась. После первой жалобы BPI в 2001 году эта услуга была отменена.

По материалам сервера CompuLenta.ru

Норвежский студент оштрафован за музыкальное пиратство в Сети

Суд норвежского города Лиллехаммера приговорил к крупному штрафу 24-летнего студента Франка Брувика, создавшего сайт napster.no, позволявший скачивать музыку в формате mp3 из Интернета.
Вскоре после открытия сайта, созданного в качестве студенческого учебного проекта, на него обратила внимания звукозаписывающая индустрия и ведомства, занимающиеся охраной авторских прав. Они подали иск в суд, и Брувик был вынужден закрыть сайт всего через несколько месяцев после начала его функционирования. В соответствии с вынесенным приговором студент должен будет заплатить штраф в размере $14.520. Сумма немалая, однако она в четыре раза меньше той, которую требовали в наказание скандинавскому парню истцы, среди которых — всемирно известные EMI и Sony.
По мнению адвоката Брувика, дело разрешилось ничьей. Суд признал незаконность размещения ссылок на музыкальные композиции, но отверг аргументы о том, что преступлением является само использование этих ссылок. Адвокат не исключает также возможности подачи его подзащитным апелляции.

По материалам сервера PROext.com

Американская ассоциация звукозаписывающих компаний заражает MP3-файлы?

По словам представителей хакерской группировки Gobbles, Американская ассоциация звукозаписывающих компаний (RIAA) планирует заражать скачиваемые из интернета MP3-файлы для мониторинга их распространения и борьбы с пиратством… В сообщении, посланном в известный список рассылки Bugtraq, Gobbles заявили, что они сами предложили RIAA свою программную разработку для мониторинга MP3-файлов, которая получила название «hydra».
«Несколько месяцев назад Gobbles Security были наняты RIAA для создания подобной системы и внедрения ее в будущие средства борьбы с пиратством. Мы были нацелены создать гибрид вируса и червя для инфицирования и распространения через p2p-сети», — отметили Gobbles в своем сообщении. Gobbles заявляют, что зараженный p2p-хост проверяет свои каталоги на наличие пиратских медиа-файлов и отправляет о них информацию в штаб-квартиру RIAA при помощи специальных запросов в p2p-сетях и так же, как и компьютерный червь, распространяет свою копию по другим компьютерам в p2p-сети для их последующего заражения

По материалам сервера: CNews.ru

В Японии пометили музыкальные файлы ‘водяными знаками’

Две японские организации правообладателей, «Японское общество прав авторов, композиторов и издателей» (JASRAC) и аналог американской RIAA — «Ассоциация звукозаписывающей индустрии Японии» (RIAJ), рассказали об эксперименте по отслеживанию распространения нелицензионных музыкальных файлов с помощью электронных «водяных знаков» из 11 цифр, который был начат еще в 2000 году.

Эксперимент был поставлен над FM-радиостанциями, передающими в интернете. В цифровой аудиопоток запустили меченую музыку. Затем JASRAC начала отслеживать эти файлы с помощью своей «шпионской системы» J-MUSE («Эксперт поиска музыки JASRAC»), которая ищет музыкальные файлы в интернете и проверяет наличие в них «водяных знаков». Ее производительность — 5,4 млн. файлов в месяц. В ходе эксперимента были обнаружены два сайта, где хранилось 12 помеченных файлов.

Пираты тоже не собираются сдаваться — они обманывают систему, пряча MP3-файлы внутрь JPEG или превращают их в текстовые файлы. Обратные превращения можно сделать с помощью специальной программы.

RIAJ, в свою очередь, поймала пиратскую музыку на нескольких интернет-радиостанциях. Эксперимент был проведен в исследовательских целях, отмечает RIAJ.

По материалам сервера CNews.ru

Обнаружилась компания, владеющая патентом на потоковое аудио и видео

Компания Acacia Media Technologies, подразделение корпорации Acacia Research, требует у владельцев мультимедийных проектов выплат за использование технологии передачи аудио- и видеоданных онлайн — одной из базовых сетевых технологий…

Acacia Media Technologies зарегистрировала соответствующие патенты и теперь, сообщает CNET News.com, заявляет, что может потребовать выплаты royalties от таких гигантов, как Microsoft и America Online.
Владельцу небольшой интернет-радиостанции RadioIO было предъявлено требование выплачивать 0,75% доходов, однако радиостанции, только закончившие изнурительную (в том числе и финансовую войну с держателями копирайта), не готовы платить и эту сумму.
По мнению представителей Acacia Media Technologies, их патенты касаются даже систему pay-per-view, использующуюся в кабельном телевидении. Желающих лицензировать технологию уже набралось немалое количество.
Руководитель интернет-радиостанции Radio Free Virgin сообщил в интервью CNET News.com, что патент Acacia — первый из многих предъявленных радиостанции, который руководство сочло действительно серьезным и стоящим лицензирования.

Другое подразделение корпорации Acacia Research, компания Soundview Technologies, владеет патентом на технологию V-chip, позволяющую зрителям отфильтровывать определенные программы. Эту технологию лицензировали крупные корпорации, среди которых Philips, Samsung и Matsushita.