Добавить новость

МИД Ирана призвал Запад "открыть новую главу" в отношениях

Нижний Новгород попал на второе место по росту цен на новостройки в РФ

В Москве пройдет всемирный фестиваль циркового искусства «Идол»

Подмосковные врачи достали игрушечную пулю из уха трехлетнего мальчика



Новости сегодня

Новости от TheMoneytizer

Microsoft's latest speech generator is so good it's afraid to release it to the public

 Microsoft's latest speech generator is so good it's afraid to release it to the public

VALL-E 2 will remain a research project due to the potential risks of 'misuse'.

This thing we made is so brilliant, we can't risk releasing it to the general public. So Microsoft basically says about it's latest speech generator, VALL-E 2. So, does that reflect genuine concerns? Or is it a clever marketing ruse designed to get some viral traction and online chins wagging?

If it is all completely genuine, what does it say about Microsoft that it's knowingly creating AI tools too dangerous to release? It's a conundrum, to be sure.

Anyway, here are the basic facts of the situation. Microsoft says in a recent blog post (via Extremetech) that it's latest neural codec language model for speech synthesis, known as VALL-E 2, achieves "human parity for the first time".

More specifically, "VALL-E 2 can generate accurate, natural speech in the exact voice of the original speaker, comparable to human performance." Now, to some extent, this is nothing new. However, it's the incredible speed with which VALL-E 2 can achieve this, or to put it another way, the incredibly limited sample or prompt it needs to achieve this feat that's remarkable.

VALL-E 2 can accurately mimic a specific person's voice based on a sample just a few seconds long. It pulls that trick off by using a huge training library that maps variations in pronunciation, intonation, cadence in the model to the sample and spits out what appears to be totally convincing synthesised speech. 

Microsoft's blog post has a range of example audio clips demonstrating how well VALL-E 2 (and indeed its predecessor, VALL-E) can turn a short sample of between three and 10 seconds into convincing synthesised speech that's often indistinguishable from a real human voice.

It's a process known as zero-shot text-to-speech synthesis or zero-shot TTS for short. Again, the approach is nothing new, it's the accuracy and shortness of the sample audio that's novel.

VALL-E 2

Microsoft claims VALL-E 2 is the first speech generator to achieve "human parity". (Image credit: Microsoft)

Of course, the idea of weaponising such tools to create fake content for nefarious purposes is likewise not a new idea. But the VALL-E 2's capabilities do seem to take the threat to a whole new level. Which is why the "Ethics Statement" appended to the blog post makes it clear that Microsoft currently has no intention of releasing VALL-E 2 to the public.

"VALL-E 2 is purely a research project. Currently, we have no plans to incorporate VALL-E 2 into a product or expand access to the public," the statement says, adding that "it may carry potential risks in the misuse of the model, such as spoofing voice identification or impersonating a specific speaker. We conducted the experiments under the assumption that the user agrees to be the target speaker in speech synthesis. If the model is generalized to unseen speakers in the real world, it should include a protocol to ensure that the speaker approves the use of their voice and a synthesized speech detection model."

Microsoft expressed similar concerns regarding its VASA-1, which can turn a still image of a person into convincing motion video. "It is not intended to create content that is used to mislead or deceive. However, like other related content generation techniques, it could still potentially be misused for impersonating humans," Microsoft said of VASA-1.

Your next upgrade

Nvidia RTX 4070 and RTX 3080 Founders Edition graphics cards

(Image credit: Future)

Best CPU for gaming: The top chips from Intel and AMD.
Best gaming motherboard: The right boards.
Best graphics card: Your perfect pixel-pusher awaits.
Best SSD for gaming: Get into the game ahead of the rest.

An obvious observation, perhaps, is that the problems that come with such models aren't exactly a surprise. You don't have to succeed in making the perfect speech synthesis model to imagine what might go wrong if such a tool was released to the public. 

So, it's easy enough to see the problem coming, but Microsoft pressed ahead anyway. Now it claims to have achieved its aims, only to decide it's not fit for public consumption.

It does rather beg the question of what other tools it is developing that it much know in advance are too problematic for general release. And then you inevitably wonder what Microsoft's aim is in all this.

There's also the inevitable genie-and-bottle conundrum. Microsoft has made this tool and it's hard to imagine how it or something very similar doesn't eventually end up out in the wild. In short, the ethics of it all are rather confusing. Where it all ends is still anyone's guess.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Душные ночи: метеоролог Позднякова предупредила о периоде ливневых дождей в столице

Подмосковные врачи достали игрушечную пулю из уха трехлетнего мальчика

Депутат Кирьянов рассказал о принципе работы сервиса «Мои SIM-карты» на «Госуслугах»

Нижний Новгород попал на второе место по росту цен на новостройки в РФ

Музыкальные новости

Катя Адушкина, AdrenalinHouse, Jazzdauren и другие артисты и блогеры зажгли на сцене Академии Игоря Крутого на VK Fest

Девушки из Псковской области стали призерами первенства России по гребле

Дубль Глушенкова, бенефис Вендела и гол Смолова: «Зенит» обыграл «Краснодар» в матче за Суперкубок России

Компания ICDMC приняла участие в XIV Фармацевтической конференции «Зелёный крест»

Новости России

Ежедневную аэрацию дорог будут проводить в Химках в жаркие дни

МИД Ирана призвал Запад "открыть новую главу" в отношениях

Станислав Кругляшов назначен гендиректором завода "Красное Сормово"

Депутат Кирьянов рассказал о принципе работы сервиса «Мои SIM-карты» на «Госуслугах»

Экология в России и мире

Культурный центр «Интеграция» на Саянской приглашает на бесплатные мастер-классы

Итоги конкурса красоты «MISS EUROPEAN BEAUTY 2024″

Сеть клиник «Будь Здоров» открывает новое направление лечения — ВМАС-терапию

Инсульт: что нужно знать?

Спорт в России и мире

Второй год подряд: Медведев взял сет у Алькараса, но вновь проиграл в полуфинале Уимблдона

Крейчикова выиграла второй турнир «Большого шлема» и вернется в топ-10

«Исхудавшая, но с сияющей улыбкой»: онкобольная Кейт Миддлтон появилась на финале Уимблдона

Елена Рыбакина получила новую конкурентку после Уимблдона-2024

Moscow.media

«Байкал Сервис» почти вдвое увеличил объемы отправок на маркетплейсы

Структуры Минздрава перешли на офисный пакет AlterOffice

Портативный ТСД корпоративного класса Saotron RT-T70

Смартфоны и гаджеты Xiaomi опять сбоят в России











Топ новостей на этот час

Rss.plus






МИД Ирана призвал Запад "открыть новую главу" в отношениях

В Подмосковье у мужчины изъяли автомобиль из-за кредиторской задолженности

Оперетта, цирк и мастер-классы: что ждет гостей фестиваля "Театральный бульвар"

В Москве пройдет всемирный фестиваль циркового искусства «Идол»