Добавить новость

Собянин: Три дороги будут построены в Москве по концессионным соглашениям

Состоится турнир по вольной борьбе на призы ЖДЯ

В Якутске пройдут всероссийский турнир и международные соревнования по вольной борьбе в честь Павла Пинигина на призы АК«Железные дороги Якутии»

ЛУКОЙЛ достиг значительного снижения выбросов парниковых газов в 2023 году

News in English


Новости сегодня

Новости от TheMoneytizer

ChatGPT now supports voice chats and image-based queries

ChatGPT is getting some significant updates that will enable the chatbot to deal with voice commands and image-based queries. Users will be able to have a voice conversation with ChatGPT on Android and iOS and to feed images into it on all platforms. OpenAI is rolling out the features now. They'll be available to Plus and Enterprise users at first, with other folks gaining access to the image-based features later.

You'll need to opt in to voice conversations in the ChatGPT app (go to Settings then New Features) if you'd like to try them out. By tapping the microphone button, you'll be able to choose from five different voices.

OpenAI says the back-and-forth voice conversations are powered by a new text-to-speech model that can generate "human-like audio from just text and a few seconds of sample speech." It created the five voices with the help of professional actors. Going the other way, the company's Whisper speech recognition system converts a user's spoken words into text.

The image-based functions are intriguing too. OpenAI says you can, for instance, show the chatbot a photo of your grill and ask why it won't start, get it to help plan a meal based on a snap of what's in your fridge or prompt it to solve a math problem you take a picture of. As it happens, Microsoft highlighted the Copilot AI's ability to solve math problems in Windows during its Surface event last week.

OpenAI is using GPT-3.5 and GPT-4 to power the image recognition features. To use ChatGPT's image-based functions, tap the photo button (you'll need to tap the plus button first on iOS or Android) to take a snap or choose an existing image on your device. You can ask ChatGPT about multiple photos and use a drawing tool to focus on a specific part of the image.

In a blog post announcing the updates, OpenAI noted the potential for harm. It's possible for bad actors to mimic the voices of public figures (and everyday folks) and perhaps commit fraud. That's why OpenAI is focusing on ChatGPT voice conversations with this technology and working with select partners on other limited use cases (more on that in a moment).

As for images, OpenAI worked with Be My Eyes, a free app that blind and low-vision people can use to help them better understand their surroundings thanks to volunteers who hop into video calls with them. "Users have told us they find it valuable to have general conversations about images that happen to contain people in the background, like if someone appears on TV while you’re trying to figure out your remote control settings," OpenAI said. The company noted that it has also limited how ChatGPT can analyze and make direct statements about people that appear in images, "since ChatGPT is not always accurate and these systems should respect individuals’ privacy." It has published a paper on the safety properties of the image-based functionality, which it calls GPT-4 with vision.

ChatGPT is more effective at understanding English text in images than other languages. OpenAI says the chatbot "performs poorly" in other languages for the time being, particularly when it comes to those that use non-Roman scripts. As such, it suggests that non-English users avoid using ChatGPT to deal with text in images for now.

Meanwhile, Spotify has teamed up with OpenAI to use the voice-based technology for an interesting purpose. The former has announced a pilot of a tool called Voice Translation for podcasters. This can translate podcasts into different languages using the voices of the folks who appear on the show. Spotify says the tool can retain the speech characteristics of the original speaker after converting their voice into other languages.

To start with, Spotify is converting select English-based shows into a few languages. Spanish versions of some Armchair Expert and The Diary of a CEO with Steven Bartlett episodes are available now, with French and German variants to follow.

This article originally appeared on Engadget at https://www.engadget.com/chatgpt-now-supports-voice-chats-and-image-based-queries-144718179.html?src=rss

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Новосибирцу выплатят 4,5 тысячи за долгое ожидание трамвая

ЛУКОЙЛ достиг значительного снижения выбросов парниковых газов в 2023 году

Маленькие квартиры ощутимо подорожали в Екатеринбурге

Развелся после венчания, бросил беременную: Какие отношения у Стаса Михайлова с внебрачной дочкой от сестры певицы Валерии

Музыкальные новости

Фазель: Евро-2024 в Германии напоминает чемпионат мира 2018 года в России

АО «Транснефть – Север» за 6 месяцев 2024 г. выполнило 26 тыс. экологических исследований

Госкорпорация „Ростех“ поддержала кинофестиваль «В кругу семьи» в Ярославле

Русские дали тонкий намёк на "кейс Кеннеди": Покушение на Трампа было предсказано дважды

Новости России

ЛУКОЙЛ достиг значительного снижения выбросов парниковых газов в 2023 году

Облил машину кислотой. Бывший любовник превратил жизнь модели в сущий ад

В Жуковском отпустили дагестанцев после убийства мужчины арматурой

Собянин: Три дороги будут построены в Москве по концессионным соглашениям

Экология в России и мире

Студия звукозаписи в Москве. Студия звукозаписи цена.

Культурный центр «Интеграция» на Саянской приглашает на бесплатные мастер-классы

В Москве стартует Восьмая межрегиональная выставка «КРАСНЫЕ ВОРОТА/ПРОТИВ ТЕЧЕНИЯ»

Итоги конкурса красоты «Miss Europe 2024»

Спорт в России и мире

Крейчикова о своем тренере Новотной, которая умерла в 2017-м: «Я даже не мечтала, что однажды выиграю тот же трофей, что и Яна»

Крейчикова о том, что вышла в финал «Уимблдона», где побеждала Яна Новотна: «Я очень по ней скучаю»

Крейчикова выиграла второй турнир «Большого шлема» и вернется в топ-10

Рыбакина столкнулась с критикой из России после неудачи на Уимблдоне

Moscow.media

Начальник ростовского ГУ ФСИН подал в отставку после захвата СИЗО

Студия звукозаписи в Москве. Студия звукозаписи цена.

Смартфоны и гаджеты Xiaomi опять сбоят в России

Портативный ТСД корпоративного класса Saotron RT-T70











Топ новостей на этот час

Rss.plus






Состоится турнир по вольной борьбе на призы ЖДЯ

Россиянам объяснили, какая жара считается аномальной

Развелся после венчания, бросил беременную: Какие отношения у Стаса Михайлова с внебрачной дочкой от сестры певицы Валерии

Облил машину кислотой. Бывший любовник превратил жизнь модели в сущий ад