Лондонский стартап Voxmind, специализирующийся на голосовой биометрии и обнаружении дипфейков, успешно закрыл предпосевной раунд финансирования, получив 546 491 фунт стерлингов. Ведущим инвестором выступила венчурная компания Ascension Ventures. В число участников раунда также вошли Марк Макдермотт (соучредитель ScreenCloud), ведущий бизнес-ангел Рассел Харт и члены Кембриджской сети инвесторов.
Это финансирование поступило в критический момент для развития корпоративных систем аутентификации. Корпорация Microsoft прекратит поддержку сервиса Azure Speaker Recognition в сентябре 2025 года, а Amazon Web Services (AWS) завершит поддержку Voice ID в мае 2026 года. Таким образом, два из трёх крупнейших облачных провайдеров сворачивают свои голосовые биометрические решения. Производители оборудования (OEM), операторы колл-центров и предприятия, которые полагались на эти сервисы, теперь остаются без долгосрочного уровня аутентификации. При этом угроза мошенничества с использованием голосовых дипфейков стремительно растёт, затрагивая финансовые услуги, телекоммуникации и корпоративные голосовые каналы.
Технология и преимущества Voxmind
Основанная в январе 2024 года, компания разработала запатентованную технологию извлечения фонетических частот. Эта система анализирует биомеханику голосового тракта человека — физические характеристики сигнала, которые определяются анатомией, а не языком.
В результате была создана система голосовой аутентификации и обнаружения дипфейков, которая изначально работает на любых языках, обеспечивает точность выявления дипфейков в 99,8 процента менее чем за 3 секунды и требует для работы менее 500 мегабайт оперативной памяти, при этом не нуждаясь в графическом процессоре (GPU) или облачном подключении.
Архитектура Voxmind изначально поддерживает три модели развёртывания:
- Комплект разработки программного обеспечения (SDK) для производителей оборудования (OEM) для интеграции непосредственно в устройства.
- Нативная интеграция для операторов "Связь как услуга" (CCaaS) и "Унифицированные коммуникации как услуга" (UCaaS) через протоколы WebSocket, gRPC, SIP/SIPREC и AudioHook.
- Облачный API для корпоративных и финтех-решений.
Планы и перспективы
По словам Джая Кирти, основателя и генерального директора Voxmind, каждое крупное предприятие, полагающееся на облачные голосовые API, сегодня подвергается риску, поскольку мошенничество с использованием ИИ-голосов набирает обороты. Он отметил, что компания разработала свою архитектуру, основанную на физических принципах и позволяющую развертывание на устройствах, ещё до возникновения текущих проблем, и теперь её задача — занять эту нишу.
Voxmind уже заключила соглашение с крупным поставщиком оборудования для унифицированных коммуникаций, интегрировав свой SDK для голосовой биометрии непосредственно в аппаратное обеспечение корпоративных IP-телефонов. Коммерческие перспективы включают сотрудничество с региональными банками в США, телекоммуникационными компаниями в Европе, а также обсуждения стратегического партнёрства с мировыми поставщиками ИТ-услуг и операторами колл-центров.
Тойоси Огеденгбе, директор Ascension Ventures, отметил, что голос остаётся последним незащищённым рубежом в корпоративной безопасности, а генеративный искусственный интеллект сделал ставки экзистенциальными. Он подчеркнул, что подход Voxmind, основанный на физических принципах, развёртывание на устройствах и уже имеющиеся партнёрства с OEM-производителями дают компании структурное преимущество, которое крайне сложно воспроизвести.
Привлечённый предпосевной капитал будет направлен на расширение коммерческих продаж в секторах финансовых услуг, телекоммуникаций и операторов колл-центров. Часть средств пойдёт на оптимизацию моделей для граничных вычислений и получение сертификации ISO 27001 (международного стандарта для систем менеджмента информационной безопасности) в течение восьми месяцев.
