Добавить новость

«Война в Заполярье: история, события, люди»: стартовали Мурманские научные чтения

Круто, парни! - юные борцы из Камышина показали класс в Волгограде на отборочном этапе фестиваля школьников

В ДЕЛАХ ЖУРНАЛИСТОВ САФРОНОВА, ГОЛУНОВА, СКРИПАЛЕЙ СЕНСАЦИОННЫЕ СЕРИИ СОВПАДЕНИЙ. Россия, США, Европа могут улучшить отношения?!

18 лет ВКонтакте: как соцсеть необычно поздравила пользователей, родившихся в один день



Новости сегодня

Новости от TheMoneytizer

Microsoft's latest speech generator is so good it's afraid to release it to the public

This thing we made is so brilliant, we can't risk releasing it to the general public. So Microsoft basically says about it's latest speech generator, VALL-E 2. So, does that reflect genuine concerns? Or is it a clever marketing ruse designed to get some viral traction and online chins wagging?

If it is all completely genuine, what does it say about Microsoft that it's knowingly creating AI tools too dangerous to release? It's a conundrum, to be sure.

Anyway, here are the basic facts of the situation. Microsoft says in a recent blog post (via Extremetech) that it's latest neural codec language model for speech synthesis, known as VALL-E 2, achieves "human parity for the first time".

More specifically, "VALL-E 2 can generate accurate, natural speech in the exact voice of the original speaker, comparable to human performance." Now, to some extent, this is nothing new. However, it's the incredible speed with which VALL-E 2 can achieve this, or to put it another way, the incredibly limited sample or prompt it needs to achieve this feat that's remarkable.

VALL-E 2 can accurately mimic a specific person's voice based on a sample just a few seconds long. It pulls that trick off by using a huge training library that maps variations in pronunciation, intonation, cadence in the model to the sample and spits out what appears to be totally convincing synthesised speech. 

Microsoft's blog post has a range of example audio clips demonstrating how well VALL-E 2 (and indeed its predecessor, VALL-E) can turn a short sample of between three and 10 seconds into convincing synthesised speech that's often indistinguishable from a real human voice.

It's a process known as zero-shot text-to-speech synthesis or zero-shot TTS for short. Again, the approach is nothing new, it's the accuracy and shortness of the sample audio that's novel.

Microsoft claims VALL-E 2 is the first speech generator to achieve "human parity". (Image credit: Microsoft)

Of course, the idea of weaponising such tools to create fake content for nefarious purposes is likewise not a new idea. But the VALL-E 2's capabilities do seem to take the threat to a whole new level. Which is why the "Ethics Statement" appended to the blog post makes it clear that Microsoft currently has no intention of releasing VALL-E 2 to the public.

"VALL-E 2 is purely a research project. Currently, we have no plans to incorporate VALL-E 2 into a product or expand access to the public," the statement says, adding that "it may carry potential risks in the misuse of the model, such as spoofing voice identification or impersonating a specific speaker. We conducted the experiments under the assumption that the user agrees to be the target speaker in speech synthesis. If the model is generalized to unseen speakers in the real world, it should include a protocol to ensure that the speaker approves the use of their voice and a synthesized speech detection model."

Microsoft expressed similar concerns regarding its VASA-1, which can turn a still image of a person into convincing motion video. "It is not intended to create content that is used to mislead or deceive. However, like other related content generation techniques, it could still potentially be misused for impersonating humans," Microsoft said of VASA-1.

Your next upgrade

(Image credit: Future)

Best CPU for gaming: The top chips from Intel and AMD.
Best gaming motherboard: The right boards.
Best graphics card: Your perfect pixel-pusher awaits.
Best SSD for gaming: Get into the game ahead of the rest.

An obvious observation, perhaps, is that the problems that come with such models aren't exactly a surprise. You don't have to succeed in making the perfect speech synthesis model to imagine what might go wrong if such a tool was released to the public. 

So, it's easy enough to see the problem coming, but Microsoft pressed ahead anyway. Now it claims to have achieved its aims, only to decide it's not fit for public consumption.

It does rather beg the question of what other tools it is developing that it much know in advance are too problematic for general release. And then you inevitably wonder what Microsoft's aim is in all this.

There's also the inevitable genie-and-bottle conundrum. Microsoft has made this tool and it's hard to imagine how it or something very similar doesn't eventually end up out in the wild. In short, the ethics of it all are rather confusing. Where it all ends is still anyone's guess.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Земля сбрасывает лишнее: экстрасенс Миронова назвала дождь в Сахаре знамением апокалипсиса

11 медалей разных категорий завоевали домодедовские спортсмены

Круто, парни! - юные борцы из Камышина показали класс в Волгограде на отборочном этапе фестиваля школьников

станция метро Кантемировская Москва

Музыкальные новости

Мари Краймбрери, Клава Кока, bearwolf и не только! Like FM устраивает звездный девичник

КХЛ. ЦСКА — «Салават Юлаев». Прямая трансляция: смотреть онлайн

«Уралкриомаш» и «Газпром гелий сервис» выпустили первое в России облегченное оборудование для транспортировки сжиженных газов

О работе целлюлозного комбината в Усть-Илимске президенту Владимиру Путину доложил губернатор Прибайкалья Игорь Кобзев

Новости России

Земля сбрасывает лишнее: экстрасенс Миронова назвала дождь в Сахаре знамением апокалипсиса

В ДЕЛАХ ЖУРНАЛИСТОВ САФРОНОВА, ГОЛУНОВА, СКРИПАЛЕЙ СЕНСАЦИОННЫЕ СЕРИИ СОВПАДЕНИЙ. Россия, США, Европа могут улучшить отношения?!

станция метро Кантемировская Москва

Ученый предупредил об усилении магнитной бури на Земле из-за выбросов плазмы

Экология в России и мире

KAMBULAT презентует новый альбом в VK Gipsy. Like FM дарит билеты

Бесплатный прогноз на год

Как понять, какое у тебя давление, без тонометра

Карди Би опровергла слухи о новой пластике словами «подумайте своими мозгами»

Спорт в России и мире

В тени победы Медведева над Циципасом: Эрика Андреева неожиданно выбила младшую сестру Мирру с турнира WTA в Ухани

Технологическая революция в теннисе: Уимблдон заменит линейных судей на искусственный интеллект с 2025 года

Александрова победила Кенин и вышла в третий круг турнира WTA 1000 в Ухани

Медведев вышел в четвертьфинал теннисного турнира в Шанхае после победы над Циципасом

Moscow.media

MONT и SETERE Group начнут сотрудничество в области продвижения ПО для российских операционных систем

Выиграй поездку на Like Party «ДЕВИЧНИК»

TODAY 50% DISCOUNT ON ALL https://boosty.to/ivanw

DатаРу становится группой компаний











Топ новостей на этот час

Rss.plus






станция метро Кантемировская Москва

Час расплаты. Суд частично снял арест со счетов Блиновской

18 лет ВКонтакте: как соцсеть необычно поздравила пользователей, родившихся в один день

Круто, парни! - юные борцы из Камышина показали класс в Волгограде на отборочном этапе фестиваля школьников