14.03.2018

О компьютерной имитации голоса и виртуальной трости для слабовидящих

Группа китайских разработчиков анонсировала технологию Deep Voice, которая работает на основе машинного обучения и способна обмануть слух человека или другую систему распознавания голоса. Deep Voice тренировали на основе звуковых записей, длящихся более 8 сотен часов и включавших в себя около 2400 разных человеческих голосов.

После обучения система имитирует тембр, и интонацию голоса собеседника, делая его неотличимым от настоящего. По мнению создателей, она может использоваться в роли цифровых помощников, в записи голоса для видеоигр, музыки и в синхронном переводе. Кроме того, в будущем система сможет пригодится тем, кто утратил возможность говорить. Ученые также отметили, что Deep Voice умеет менять голос, делая его мужским вместо женского или добавляя ему иностранный акцент. Любопытно, что на сегодняшний день это не первая подобная разработка. Ранее канадские специалисты презентовали голосовой сервис способный сжимать все индивидуальные речевые характеристики в очень короткую запись, воспроизводя 1000 предложений всего за полсекунды. Он также способен копировать любые бытовые звуки — например, работающую бензопилу или пение конкретного вида птиц, может изображать сердитый, веселый или сочувствующий тон. Канадская разработка, также как и Deep Voice, применяется для работы голосовых помощников, озвучивания мультимедийных продуктов и синтеза речи людей с ограниченными возможностями. Главной проблемой, таких систем специалисты считают то, что ими могут воспользоваться мошенники для того, чтобы вводить людей в заблуждение или воспользоваться возможностями программ, которые работают на основе распознавания речи. Юристы также отмечают, что в скором времени аудиозаписи голоса перестанут носить доказательную базу в судах и применяться для банковского обслуживания.

Специалисты Microsoft смогли адаптировать виртуальную реальность для людей с нарушениями зрения. Теперь незрячие или слабовидящие, смогут воспользоваться специальной виртуальной тростью, чтобы воссоздать незнакомую дорогу и потренироваться в её прохождении без риска для здоровья и психики.

Система состоит из пояса, на котором крепится длинный металлический стержень, удерживающий саму трость, а также трекер и виртуальный шлем. Пользователь действует как обычно, при движении ощупывая VR-тростью помещение. В момент, когда она натыкается на виртуальный объект, задействуются встроенные в трость вибромоторы, имитируя столкновение с объектом, и сигнализируя пользователю о том, что нужно остановиться. При этом наушники гарнитуры воспроизводят соответствующий характеристикам предмета звук, например, глухой удар о металлический бак или стук, характерный для столкновения с деревянной мебелью. Система также умеет симулировать и другие ощущения. Пользователь чувствует, что идёт по ковру или плитке, может определить, что впереди находится небольшое препятствие, например бордюр. Сейчас система проходит испытание на добровольцах, при этом сообщается, что 8 из 10 участников смогли без особых проблем сориентироваться в виртуальной реальности уже после десяти минут использования гаджета.

Поделиться
Комментировать

Рекомендуем

Сифуд-бистро Kit
Улица Рубинштейна, уже как коммуналка, и продолжает уплотняться, как сказал бы Швондер. Теперь и сифуд-бистро KIT. Тут хорошо! Меню прекрасного..
Специалист по навигации в условиях Арктики
«…тот, кто ввел многих в заблуждение, сообщая, что пересек всю Британию пешком, помещает остров окружностью в 40 тысяч стадий и рассказывает о Туле,..
О недвижимости в итальянском регионе Молизе
Молизе — это небольшой южный регион Италии, где живет немногим более 300 тыс. человек. Он состоит из двух провинций, граничит с Апулией, Кампанией,..
Аукционные итоги 2017 года
Март — месяц больших цифр. Появились первые отчеты, посвященные состоянию аукционного рынка в прошлом году.

Комментарии

На данный момент никто не оставил комментариев.