Мы в Telegram
Добавить новость

Облачная погода без осадков ждет Москвичей 8 июня

Исследование – употребление фасоли снижает риск развития хронических заболеваний

«Казанские парни»: первый татарский спектакль с продолжением

Мужчину, напавшего на премьер-министра Дании, арестовали





Новости сегодня

Новости от TheMoneytizer

Multimodal: AI’s new frontier

Multimodality is a relatively new term for something extremely old: how people have learned about the world since humanity appeared. Individuals receive information from myriad sources via their senses, including sight, sound, and touch. Human brains combine these different modes of data into a highly nuanced, holistic picture of reality.

“Communication between humans is multimodal,” says Jina AI CEO Han Xiao. “They use text, voice, emotions, expressions, and sometimes photos.” That’s just a few obvious means of sharing information. Given this, he adds, “it is very safe to assume that future communication between human and machine will also be multimodal.”

A technology that sees the world from different angles

We are not there yet. The furthest advances in this direction have occurred in the fledgling field of multimodal AI. The problem is not a lack of vision. While a technology able to translate between modalities would clearly be valuable, Mirella Lapata, a professor at the University of Edinburgh and director of its Laboratory for Integrated Artificial Intelligence, says “it’s a lot more complicated” to execute than unimodal AI.

In practice, generative AI tools use different strategies for different types of data when building large data models—the complex neural networks that organize vast amounts of information. For example, those that draw on textual sources segregate individual tokens, usually words. Each token is assigned an “embedding” or “vector”: a numerical matrix representing how and where the token is used compared to others. Collectively, the vector creates a mathematical representation of the token’s meaning. An image model, on the other hand, might use pixels as its tokens for embedding, and an audio one sound frequencies.

A multimodal AI model typically relies on several unimodal ones. As Henry Ajder, founder of AI consultancy Latent Space, puts it, this involves “almost stringing together” the various contributing models. Doing so involves various techniques to align the elements of each unimodal model, in a process called fusion. For example, the word “tree”, an image of an oak tree, and audio in the form of rustling leaves might be fused in this way. This allows the model to create a multifaceted description of reality.

This content was produced by Insights, the custom content arm of MIT Technology Review. It was not written by MIT Technology Review’s editorial staff.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

В Санкт-Петербурге прошел Кубок ПМЭФ по конкуру

Дорогие дороги

«Больниц теперь не боюсь». Стебунов рассказал о травме, изменившей его жизнь

Красавица красноперка

Музыкальные новости

Новости и Культура, Дети и Россия: кукольный Театр Ульгэр выступил в Улан-Улан-Удэ в Этнографическом музее народов Забайкалья перед детьми и родителями в семейный праздник

Клиники «Будь Здоров» — в лидерах рейтинга лучших клиник 2ГИС

Яндекс, А.С. Пушкин, Святой Ленин ведут следствие. Настоящая сенсация!

В ПРЕДДВЕРИИ ДНЯ РОССИИ РОСГВАРДЕЙЦЫ ПРОВЕЛИ ПРАЗДНИЧНОЕ МЕРОПРИЯТИЕ ДЛЯ ДЕТЕЙ

Новости России

Дорогие дороги

«Больниц теперь не боюсь». Стебунов рассказал о травме, изменившей его жизнь

В Санкт-Петербурге прошел Кубок ПМЭФ по конкуру

9 июня: какой сегодня праздник, что было в этот день

Экология в России и мире

Культурный центр «Интеграция» проведет концерт ко Дню России в Перовском парке

Фонд «Восход» выпустил на «Атомайз» первые в России венчурные ЦФА

Уникальный интерактивный проект Ставропольской психиатрической больницы на выставке-форуме «Россия»

Адские цены на Сочи и Анапу заставили российских туристов найти новые пути экономии

Спорт в России и мире

Зверев вышел в финал «Ролан Гаррос»

Андреева рассказала о своих планах на предстоящий матч с Соболенко во Франции

Экс-теннисист Ольховский: российские теннисисты выступили ниже ожиданий

Теннисистка Андреева заявила, что хочет войти в топ-20 рейтинга WTA ради собаки

Moscow.media

Несмотря на санкции, Amazon поставляла технологии распознавания лиц в Россию

Филиал № 4 ОСФР по Москве и Московской области информирует: С начала года более 4,7 тысячи жителей Московского региона оформили страховую пенсию в автоматическом режиме на портале госуслуг

SURREAL NAMIBIA

Ученые нашли «выключатель» болезни Паркинсона











Топ новостей на этот час

Rss.plus






Красавица красноперка

Сбивший детей в Можайске водитель разогнал Maserati до 280 км/ч

Премьер-министр Дании Фредериксен заявила, что потрясена нападением на нее

В Санкт-Петербурге прошел Кубок ПМЭФ по конкуру