Бизнес / Технологии Технологии на основе искусственного интеллекта могут помочь людям с нарушениями речи работать удаленно Автор: Надя Ли-Хьюитсон, CNN 4 минуты чтения Опубликовано 4:26 утра по восточному поясному времени, пн., 23 сентября 2024 г. Ссылка скопирована!
Вы, вероятно, испытывали разочарование, когда вас неправильно слышал или не понимал умный динамик или помощник на базе искусственного интеллекта. Для людей с нестандартной речью это может произойти практически при каждом взаимодействии с такого рода технологиями — израильская компания Voiceitt стремится изменить это.
Используя персонализированные голосовые модели, система распознавания речи на базе искусственного интеллекта помогает людям с нарушениями речи, вызванными такими заболеваниями, как детский церебральный паралич, болезнь Паркинсона, синдром Дауна или инсульт, более эффективно общаться как с людьми, так и с цифровыми устройствами.
Для соучредителя Voiceitt Сары Смолли содействие распознаванию нестандартных речевых моделей является личной миссией.
«У моей бабушки диагностировали раннюю форму болезни Паркинсона, — сказала она. — К тому времени, как я родилась, она утратила большую часть своих двигательных способностей, а ее речь была нарушена».
Voiceitt был запущен как приложение в 2021 году и работал как простой голосовой переводчик, преобразующий нестандартную речь в аудио. ИИ обучается пользователем, который записывает себя, произнося около 200 простых стандартных фраз.
Смолли рассказал, что первоначальная идея заключалась в содействии личному общению, но теперь технология также адаптирована для удаленных работников.
Voiceitt разработала интеграцию с WebEx и ChatGPT, а также расширение Google Chrome, которое преобразует нестандартную речь в субтитры, отображаемые на экране. Компания также сотрудничает с Zoom и Microsoft Teams.
«Одной из вещей, которая действительно бросилась мне в глаза, была важность технологии доступности на рабочем месте», — отметила Смолли. «То, чем пандус для инвалидной коляски был для вчерашнего офисного здания, Voiceitt стал для сегодняшнего удаленного рабочего места», — сказала она.
Программное обеспечение продается либо поминутно, либо по лицензии на пользователя, цены варьируются от $20 до $50. Лицензии можно покупать оптом для рабочих мест, а также учреждений здравоохранения или образования.
«Люди используют Voiceitt не только для видеоконференций, но и для написания документов, электронных писем, публикации в LinkedIn и голосового доступа к веб-браузерам», — пояснил Смолли. «Это открыло цифровой мир для людей, которые раньше не рассматривались для определенных должностей или не могли общаться с коллегами или клиентами».
«Весь этот сектор нуждается в встряске»
Среди пользователей Voiceitt — Колин Хьюз, бывший продюсер BBC, ставший сторонником доступности. Живя с мышечной дистрофией, Хьюз полагается на диктовку для своего цифрового взаимодействия, что заставляет его остро осознавать как потенциал, так и ограничения современных технологий. Хьюз использовал Voiceitt для составления электронных писем и диктовки более длинных текстов.
«Я обнаружил, что приложение Voiceitt оказалось впечатляюще точным с моей нетипичной речью, а его процесс обучения и настройки был простым», — сказал Хьюз, хотя он и подчеркнул критические пробелы для профессиональных пользователей. «Многим людям с нарушениями речи и нарушениями верхних конечностей нужно больше, чем просто преобразование речи в текст», — отметил он.
Он выступает за такие функции, как голосовое управление курсором и улучшенное распознавание диктовки для составления длинного контента, утверждая, что Voiceitt лучше всего подходит для сообщений, состоящих из одного предложения.
Хьюз подчеркивает необходимость более комплексной технологии распознавания речи, которая позволит пользователям управлять электронной почтой и форматировать документы с помощью голоса.
Он видит будущее, в котором технологии будут играть большую роль в обеспечении доступности, добавляя: «Весь этот сектор нуждается в встряске. Voiceitt, имеющий лучший доступ к основным платформам, может стать тем, кто возглавит эти изменения».
Доступное будущее
По словам Смолли, за последние годы наблюдается значительный прогресс в технологии распознавания речи.
Одним из примеров является проект «Доступность речи» — исследовательский проект, реализуемый Институтом передовой науки и технологий Бекмана при Иллинойсском университете. В рамках проекта собираются голосовые данные людей с различными заболеваниями для создания алгоритмов поддержки людей с нестандартной речью.
Ранее в этом году компания Apple (AAPL) запустила функцию «Прослушивание атипичной речи» на базе искусственного интеллекта, которая использует машинное обучение для распознавания более широкого спектра речевых моделей.
С технологией, которая захватывает и хранит персональные данные, такие как голосовые записи, конфиденциальность может быть проблемой для пользователей. Смолли говорит, что ее компания соблюдает правила Европейского Союза, которые она называет «самыми высокими стандартами в мире с точки зрения конфиденциальности данных».
«Если данные пользователя хранятся в нашей базе данных с его согласия, они анонимизируются и обезличиваются, а затем используются для дополнения нашего стека данных и улучшения нашего алгоритма», — добавляет она.
Она считает, что технология Voiceitt может изменить жизнь. «Мы хотим позволить людям не только быть более независимыми в своей жизни и работе, — говорит Смолли, — но и наслаждаться технологиями и веселиться».