Глава программного обеспечения Rivian: голосовое управление — будущее автомобильных интерфейсов

Вассим Бенсаид, главный директор по программному обеспечению компании Rivian и согенеральный директор совместного предприятия Rivian и Volkswagen, известного как RV Tech, поделился своим видением будущего автомобильных технологий. По его словам, искусственный интеллект и голосовое управление станут основной формой взаимодействия с автомобилем, вытеснив традиционные физические кнопки и даже платформы для дублирования экрана смартфона, такие как Apple CarPlay и Android Auto.

Совместное предприятие RV Tech: амбиции и стратегия

Совместное предприятие RV Tech было запущено около полутора лет назад при значительных инвестициях от Volkswagen в размере почти 6 миллиардов долларов США. Эта инициатива фактически возлагает на Бенсаида ответственность за разработку операционной системы и электрической архитектуры для всех будущих электромобилей Volkswagen и связанных с ним брендов, включая такие известные имена, как Audi, Porsche, Bentley, Lamborghini, а также новые компании, например, Scout.

Обозревателя интересовали детали работы совместного предприятия, его структура, призванная сохранить уникальную программную культуру Rivian, которую Бенсаид считает ключевым элементом всего проекта. Также обсуждались границы совместной работы: какие части программного обеспечения останутся эксклюзивными для Rivian, а какие базовые технологии будут доступны как небольшой компании, так и гиганту Volkswagen Group.

Революция Rivian R2 и интеллектуальный помощник

Для Rivian текущий момент является ключевым: компания готовится к выпуску более доступного электромобиля Rivian R2, который станет первым транспортным средством на базе новой архитектуры. Кроме того, недавно в автомобилях Rivian R1 был представлен интеллектуальный помощник Rivian Assistant с функциями искусственного интеллекта. Бенсаид рассматривает Assistant как начало новой эры для Rivian в создании более «агентной» программной платформы для своих автомобилей.

Тестирование Rivian Assistant в автомобиле R1S показало его значительную мощь и увлекательность, хотя и выявило ряд интересных особенностей, требующих доработки. Это вызвало множество вопросов относительно будущих возможностей искусственного интеллекта и голосовых помощников в автомобилях, а также их способности полностью заменить физические элементы управления.

Автомобильная индустрия на перепутье: взгляд Вассима Бенсаида

Бенсаид подчеркнул, что автомобильная промышленность переживает глубокую трансформацию, вызванную значительным увеличением количества программного обеспечения в автомобилях — за счет электрификации, подключения к сети и систем автономного вождения. Это создает большой разрыв между традиционными производителями (OEM) и новыми технологическими компаниями.

Современные потребители предъявляют гораздо более высокие требования к общему пользовательскому опыту и удобству. Многие OEM-производители пытались внедрить собственное программное обеспечение, но это оказалось непросто. Для этого требуется совершенно другой тип специалистов и зачастую полная культурная перестройка, включающая более гибкие методологии разработки.

По словам Бенсаида, партнерство с Volkswagen Group стало решением этой проблемы. Оно объединяет технологический стек Rivian — программное обеспечение, электрическую архитектуру, а также ДНК и культуру компании — с невероятными масштабами Volkswagen Group. Это открывает уникальные возможности для обеих сторон, поскольку разработанное решение сможет использоваться не только в автомобилях Rivian (R2 станет первой моделью), но и во всех будущих электрических моделях VW Group, от премиум-класса до массового сегмента.

«Программно-определяемые» автомобили: новое понимание

Бенсаид признался, что не любит термин «программно-определяемый автомобиль», но использует его из-за отсутствия лучшей альтернативы. Он объяснил, что традиционная архитектура автомобилей представляет собой совокупность множества механических компонентов и сотен электронных блоков управления (ЭБУ), каждый из которых выполняет свою узкую функцию. Интеграция сквозных функций требовала огромной координации между многочисленными поставщиками и очень длительных циклов разработки.

В качестве примера была приведена функция распознавания водителя по цифровому ключу Apple: когда водитель подходит к Rivian, автомобиль распознает его, запускает световую последовательность, а затем автоматически настраивает весь профиль — сиденья, рулевое колесо, информационно-развлекательную систему, климат-контроль. Эта 15-секундная последовательность в традиционном мире потребовала бы координации более чем 10 поставщиков.

Современные автомобили становятся интегрированными системами с так называемыми «зональными компьютерами» — мощными вычислительными блоками общего назначения, размещенными в центре автомобиля, которые выступают в роли централизованного «мозга» для различных функций. Чем больше программного обеспечения можно переместить на эти зональные компьютеры, тем больший контроль производитель получает над сквозными функциями для клиентов.

Уроки прошлого: почему Rivian и Volkswagen добьются успеха

Обозреватель напомнил, что крупные автопроизводители уже давно осознали проблему разрозненности ЭБУ. Примеры, такие как заявления гендиректора Ford Джима Фарли о сокращении ЭБУ или неудача собственного проекта Volkswagen CARIAD, показывают, что проблема не нова. Бенсаид объяснил, почему новое совместное предприятие с Rivian имеет все шансы на успех там, где Volkswagen ранее потерпел неудачу.

Главный директор по программному обеспечению Rivian высоко оценил решение Volkswagen Group о необходимости абсолютно нового подхода к разработке программно-определяемых автомобилей. Он выделил два ключевых фактора:

  • Правильные специалисты: нужны таланты, способные разрабатывать истинное программное обеспечение, а не абстрактные функции, как это часто бывает в автомобильной промышленности (например, AUTOSAR). Речь идет о написании операционной системы с чистого листа.
  • Глубокие культурные изменения: необходим совершенно иной подход к проектированию и разработке автомобиля. В отличие от традиционной модели, где автомобили определяются за многие годы вперед по фиксированной «водопадной» модели, Rivian проектирует автомобиль вокруг электрической архитектуры, программного обеспечения и его адаптивности. Это позволяет автомобилю развиваться и улучшаться со временем.

Подобные глубокие изменения, по мнению Бенсаида, требуют либо правильного партнера, либо полного отказа от старых методов. В данном случае Volkswagen Group приняла верное решение, не только приняв технологии Rivian, разработанные с нуля, но и интегрировав культуру, подход и ДНК Rivian как компании.

Структура RV Tech и разделение ролей

Вассим Бенсаид является согенеральным директором RV Tech вместе с Карстеном Хельбингом, техническим директором Volkswagen. Бенсаид руководит технической командой, отвечающей за программную и электрическую инженерию. Хельбинг, со своей стороны, занимается операционными вопросами и является основным связующим звеном с Volkswagen Group, управляя сложными требованиями и запросами различных брендов.

Совместное предприятие отвечает за базовую электрическую архитектуру и операционную систему. По словам Бенсаида, практически каждое взаимодействие с современным автомобилем сегодня осуществляется через программное обеспечение, даже если пользователь этого не осознает (например, навигация, управление движением, энергосбережение, комфорт в салоне). RV Tech стремится создать электрическую архитектуру с минимальным количеством компьютеров для упрощения компоновки и снижения стоимости компонентов.

При этом совместное предприятие выполняет от 80% до 90% всей сложной работы, предоставляя «крючки» для кастомизации. Это позволяет автомобилям Audi ездить как Audi, а Lamborghini иметь иной пользовательский интерфейс, чем Rivian, при этом работая на одной и той же базовой платформе.

Масштаб и миссия RV Tech

На данный момент сфера деятельности совместного предприятия ограничена питанием всех электромобилей Volkswagen Group. Бенсаид подчеркнул, что присоединился к Rivian именно из-за миссии — ускорить электрификацию и сделать ее доступной для большего числа автомобилей по всему миру. Одним из первых продуктов, созданных с Volkswagen Group, станет ID.1 — массовый автомобиль стоимостью менее 25 000 долларов США, который сделает технологии Rivian доступными для широкого круга потребителей.

В RV Tech работает около 1500 человек. Изначально в команду вошли около 800-900 разработчиков из Rivian и около 50 сотрудников из Volkswagen Group. Остальные — это специалисты, нанятые за последние 18 месяцев. Все они являются сотрудниками RV Tech, что способствует формированию единой культуры.

Бенсаид считает своей главной задачей рост компании и развитие двух её основных активов: технологий и людей/культуры. Ежедневной задачей является сохранение ДНК Rivian: гибкости, оперативности, приоритета действий, быстрого принятия решений и итеративного подхода, что позволяет оставаться в авангарде инноваций.

Гибкость платформы: от Unreal Engine до CarPlay

Обозреватель отметил, что Rivian, как известно, использует игровой движок Unreal Engine для графики в своей информационно-развлекательной системе, что придает ей уникальный вид. Однако возникает вопрос, смогут ли другие бренды, такие как Volkswagen, использовать свои собственные решения или, например, интегрировать CarPlay. Бенсаид объяснил, что задача состоит в создании программного обеспечения таким образом, чтобы оно допускало различные реализации.

Интерфейс Rivian может отображаться через Unreal Engine, но фреймворк RV Tech также будет содержать «крючки», позволяющие автомобилям Volkswagen иметь поддержку CarPlay, даже если Rivian не будет её использовать. Это подтверждает гибкость операционной системы, способной поддерживать различные пользовательские интерфейсы.

Принятие решений: принципы Вассима Бенсаида

Бенсаид поделился своим подходом к принятию решений, который основан на нескольких ключевых принципах:

  • Децентрализация: максимально возможное делегирование решений на низшие уровни организации, что ускоряет процессы и расширяет полномочия сотрудников.
  • Множество вариантов: при представлении проблемы необходимо предлагать не менее двух вариантов решения, с анализом и рекомендацией. Это поощряет команду к более глубокому осмыслению и активному участию.
  • «Односторонние» и «двусторонние» решения:
    • Двусторонние решения — те, которые легко отменить. На них не нужно тратить много времени или собирать огромное количество данных. Часто достаточно интуиции, особенно если решение не критично.
    • Односторонние решения — те, последствия которых необратимы. Они требуют гораздо более тщательной подготовки, сбора данных и детального анализа.

В качестве примера «одностороннего» решения Бенсаид привел стратегический выбор в отношении искусственного интеллекта: использовать стороннее решение или разрабатывать собственное. Несмотря на сложности, было принято решение о создании собственной платформы, что позволяет Rivian контролировать интеграционный слой и операционную систему всего автомобиля, а также свободно менять базовые модели ИИ.

Rivian Assistant: возможности и особенности

Rivian Assistant, разработанный на собственной платформе ИИ, представляет собой не просто чат-бот, а связующее звено, позволяющее пользователям взаимодействовать практически со всеми функциями автомобиля и интегрировать свою личную цифровую экосистему. Assistant может менять режимы вождения, регулировать высоту подвески (до 88 км/ч), но при этом намеренно блокирует некоторые функции, связанные с безопасностью, такие как управление стеклоочистителями или функциями помощи на шоссе, из-за требований омологации и регулирования.

В ходе тестирования был выявлен интересный момент: помощник отказался сообщить, почему не может получить доступ к датчику присутствия на заднем сиденье. Бенсаид признал это ошибкой и пообещал, что команда откалибрует ответ и исправит проблему в следующем беспроводном обновлении. Он подчеркнул, что архитектура помощника глубоко интегрирована в операционную систему автомобиля, и в теории он должен выполнять все доступные функции, кроме тех, что сознательно заблокированы по соображениям безопасности или надежности работы языковых моделей.

Голосовое управление против кнопок: взгляд в будущее

В 2024 году Бенсаид высказывался о том, что физические кнопки в автомобиле являются аномалией современного дизайна, предрекая голосовому управлению роль основного интерфейса. Он по-прежнему глубоко убежден, что голос должен стать основным способом взаимодействия с автомобилем, особенно во время вождения, когда внимание водителя сосредоточено на дороге.

Бенсаид признает, что в прошлом технологии голосового управления были несовершенны. Однако появление фундаментальных моделей ИИ дает возможность создать истинно разговорный интерфейс. Водителям больше не нужно использовать точные команды; достаточно сказать: «У меня сумка спереди автомобиля», и багажник откроется. Это полностью меняет взаимодействие с транспортным средством.

Благодаря «агентной» архитектуре пользователи смогут вернуть себе время в автомобиле, выполняя операции с календарем или электронной почтой через голосовые команды. В будущем возможна интеграция «агент-к-агенту», которая позволит взаимодействовать со многими другими приложениями из личной цифровой экосистемы.

«Агентная» интеграция и её преимущества

В качестве примера «агентной» интеграции приводится синхронизация с Google Calendar: Rivian Assistant может читать, добавлять и удалять события из календаря после подключения через QR-код. Это реализуется через интеграцию MCP (Multi-Context Protocol), которая позволяет обмениваться контекстом и выполнять несколько операций в рамках одного запроса.

Такой подход, по мнению Бенсаида, позволяет агрегировать и связывать множество приложений через единый «агентный» фреймворк, предоставляя унифицированный пользовательский опыт. Это дает возможность, например, планировать поездки с остановками для зарядки и поиска итальянских ресторанов, а затем отправлять резюме поездки в календарь и по SMS. В будущем это может привести к более автономным функциям, таким как напоминания о встречах и предложение предварительного прогрева автомобиля.

Место логики: автомобиль, телефон или облако?

Возникает вопрос, где будет располагаться логика этих взаимодействий — в автомобиле, на ноутбуке или в телефоне. Бенсаид считает, что это будет комбинация. Rivian Assistant выступает в роли «оркестратора агентов», обладающего привилегиями благодаря глубокой интеграции с системами управления автомобилем и операционной системой. Он понимает вопросы безопасности и приоритетности задач лучше, чем любое стороннее приложение.

В то же время, Assistant имеет интерфейсы и подключения к другим агентам. В будущем пользователи смогут подключать свои любимые помощники и чат-боты к автомобилю, которые будут обмениваться контекстом с Rivian Assistant. Однако Бенсаид подчеркнул, что ни один другой помощник не сможет знать столько о системах управления автомобилем, сколько Rivian Assistant.

На данный момент Rivian Assistant является эксклюзивной разработкой Rivian, созданной для автомобилей этого бренда, поскольку Rivian видит будущее в «ИИ-определяемых» транспортных средствах. Однако ведутся переговоры о внедрении аналогичных технологий и для Volkswagen Group.

Проблемы подключения и локального ИИ

Автомобили Rivian R1 используют подключение LTE. Бенсаид признал, что при голосовом управлении, зависящем от облачных вычислений, могут возникать задержки. Однако Rivian R2, который скоро появится, будет поддерживать 5G и обладать значительно более мощным локальным ИИ. Под «локальным ИИ» понимается выполнение вычислений непосредственно на бортовом компьютере автомобиля, а не в облаке.

В R2 локальный компьютер будет располагать до 200 триллионов операций в секунду (ТОПС) вычислительной мощности, выделенной специально для ИИ. Это, по словам Бенсаида, мощнее, чем некоторые современные платформы для автономного вождения и ИИ-вычисления в смартфонах. Такая мощь позволит избежать ограничений подключения и снизить задержки, обеспечивая практически мгновенный разговорный опыт.

Важный вопрос — баланс между стоимостью вычислительных ресурсов (видеокарт, оперативной памяти) в автомобиле и другими компонентами. Бенсаид отметил, что гендиректор Rivian Ар-Джей Скариндж мыслит масштабно и долгосрочно. Он понимает, что мир движется к ИИ, и инвестиции в высокопроизводительные вычисления и память в автомобиле являются будущим. В долгосрочной перспективе это экономически выгодно, так как снижение необходимости постоянного обмена данными с облаком сокращает затраты на связь и облачные вычисления.

Архитектура Rivian Assistant не зависит от конкретной модели ИИ и позволяет легко подключать различные фундаментальные модели. В настоящее время используются комбинации внутренних моделей для локальных вычислений и моделей от Google, включая расширенный доступ к Gemini и использование Google для обоснования результатов.

Обозреватель также поднял вопрос о скорости получения информации. Помощник предоставил заголовки новостей суточной или двухсуточной давности, хотя в теории должен был подключаться в реальном времени через Google. Бенсаид пообещал разобраться с этой проблемой. Также обсуждался вопрос энергетической стоимости сложных запросов к ИИ: хотя доступ к Rivian Assistant требует ежемесячной платы за подключение, компания использует методы ограничения скорости запросов и переводит больше вычислений на локальный уровень для оптимизации затрат.

CarPlay и Android Auto: устаревший подход?

Позиция Бенсаида относительно CarPlay и Android Auto осталась неизменной. Он считает, что решения для дублирования экрана занимают весь дисплей автомобиля, что противоречит философии Rivian о взаимодействии с пользователями. Rivian стремится к созданию сквозных функций, где навигация точно знает о режиме движения и эффективности автомобиля, предлагая высокий уровень удобства.

Бенсаид отметил, что пять лет назад более 70% клиентов Rivian запрашивали CarPlay. В недавних опросах этот показатель снизился до менее 25%. Он связывает это с уровнем функций, сквозной интеграции и удобства, которые Rivian предоставил своим клиентам. По его словам, развитие ИИ-технологий делает дискуссию о CarPlay полностью устаревшей, поскольку возможности глубокой ИИ-интеграции в автомобиле меняют подход к приложениям с монопоточными интерфейсами на «агентные» решения, предоставляющие целостный пользовательский опыт.

На вопрос о том, как быть с небольшими приложениями, которые никогда не будут встроены в автомобильную систему (например, приложение для чтения Библии), Бенсаид ответил, что не обязательно создавать для них «агентную» интеграцию. В будущем открытый фреймворк позволит использовать любимого голосового помощника в автомобиле для воспроизведения контента из такого приложения через Bluetooth аудио. Это отличается от дублирования экрана, которое отвлекает водителя и занимает весь дисплей. Будущее видится в создании третьего пути: глубокой интеграции с личным устройством пользователя через ИИ, а не простое отображение его интерфейса.

Бенсаид также представил картину будущего, где Rivian Assistant может интегрироваться с любимыми службами доставки еды, зная, когда водитель будет дома, и автоматически заказывая еду по голосовой команде. Эти бесшовные и интуитивные взаимодействия, соединяющие различные поверхности цифровой экосистемы, возможны только благодаря такой глубокой интеграции.

Будущее Rivian: R2 и R3X

В завершение интервью был задан вопрос о дате выхода Rivian R3X — по словам Бенсаида, его любимого автомобиля. Он объяснил, что решение о выпуске R2 раньше R3X было сложным, но стратегически важным. R2 имеет все шансы стать чрезвычайно успешным внедорожником для семей в США. По мере увеличения объемов производства и масштабирования компании, Rivian сможет позволить себе выпускать такие эмоциональные и яркие автомобили, как R3X.