Добавить новость

Цветы к памятнику военным морякам возложили в Павловском Посаде

В Благовещенске мужчина с игрушечным пистолетом пытался украсть лекарство

Победивший в Венесуэле Мадуро на историческом примере предсказал исход СВО

Сотрудники администрации проверили качество капремонта трех домов в Мытищах

News in English


Новости сегодня

Новости от TheMoneytizer

Microsoft Won't Let You Use Its New AI Voice Tool

It's so good, it's not safe for you to use.

It's no secret that AI is getting pretty darn realistic: Companies like OpenAI are making tools that can replicate images, audio, and videos in ways that are becoming increasingly more difficult to identify as such on the fly. But while it's bad enough that some of these programs are available to the public already, it's concerning to hear about a tool that's so good, it's being kept from the rest of us.

Vall-E 2 can steal your voice

As reported by TechSpot, Microsoft has created a new version of its "neural codec language model," Vall-E, appropriately now called Vall-E 2. Microsoft detailed Vall-E 2's advances in a blog post, highlighting some key milestones with this latest model. Chiefly, Vall-E 2 achieves "human parity," which seems to be a fancy way of saying, "Our model's outputs sound like real humans." Be afraid.

Vall-E 2 apparently achieves two key enhancements over Vall-E: The new model doesn't have an "infinite loop" issue the original had when processing repeating tokens. The new model accounts for repeating tokens, and thus is able to decode a sample that contains them. In addition, Vall-E 2 shortens the length of a given sequence by grouping codec codes, which Microsoft says both increases interference speed, and skips over issues that arise from modeling long sequences.

If that's all a bit technical, perhaps this won't be: Vall-E 2 improves upon Vall-E in "speech robustness, naturalness, and speaker similarity," and, according to Microsoft, is the first of its class to achieve human parity in these categories. In fact, the company says, "VALL-E 2 can generate accurate, natural speech in the exact voice of the original speaker, comparable to human performance."

It's not just theory

You don't just have to read about Vall-E 2 to believe how good it is: Microsoft offers examples of how Vall-E 2 can take a sample recording of a voice, and replicate it when prompted with new text. The company also provided examples of the model completing a sentence after being given segments of a sample recording, in three, five, and 10-second chunks. This demonstrates the model's ability to take a very short example of a voice, and replicate it with text that doesn't appear in the original sample recording.

There are still plenty of the quirks you'd expect to find with any text-to-speech model (incorrect pronunciations, stuttered speech, etc.) but there's no doubt that the Vall-E 2 examples are not only often realistic, but match the voice of the original sample quite closely. It especially does well when given a longer recording of a voice: If given three seconds of a recording, the output is still impressive, but when given a five or, especially, a 10-second recording, the output can be remarkably realistic.

If you click through the examples yourself, check out how well Vall-E 2 matches the 10-second recording when reciting "My life has changed a lot" under "VCTK Samples." I don't have any experience with training AI systems, but to my ear, the model nails the raspy voice of the speaker in the sample, especially after receiving the full 10-second clip. It's jarring to hear the original speaker reading a certain sentence, then hear the model speak a new sentence in a voice that essentially matches the speaker's.

Vall-E 2's risks

But if you're a bit freaked out by this whole thing, you aren't alone. Microsoft is aware its model could be dangerous if used maliciously: In an ethics statement at the bottom of the post, the company acknowledges that, while Vall-E 2 could be used for a variety of positive tasks, it could also be used to impersonate a specific person. Microsoft says the model is meant to be used with consenting users who understand their voice is being replicated, and that the model should have a protocol to check for consent before processing a request. That said, it doesn't seem like such a protocol actually exists right now, which is likely why Microsoft current has, "no plans to incorporate VALL-E 2 into a product or expand access to the public."

The examples here are based on voice samples the LibriSpeech and VCTK datasets, not from samples Microsoft recorded themselves. As such, as a outside observer, it isn't clear how this model would actually perform if given recordings of, say, President Biden, Elon Musk, or your boss. However, if we assume that Vall-E 2 can generate a realistic output when given a 10-second sample, imagine how realistic its output could be when fed with hours of samples. Couple that with a solid AI video model, and you have the perfect storm for generating misinformation, just in time for election seasons across the globe.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Минэкологии оштрафовало 4 нарушителей за сброс мусора в Красногорске

Второй и первый класс пожарной опасности установится в Подмосковье до конца июля

BTL-агентство "МЫ"- услуга промоутера в ростовой кукле

Свыше 13 тысяч светильников обновят в Химках до конца года

Музыкальные новости

Юрий Быков рассказал, почему выбрал Нижний Новгород для съемок «Метода»

Росгвардейцы обеспечили безопасность на футбольном матче «Динамо» - «Локомотив» в Москве

Кажетта Ахметжанова отдыхает в Якутии и делится местами силы

Собянин рассказал о благоустройстве парков в Москве

Новости России

«Загрузка более чем на 90%». Туристический сезон-2024 в Крыму в самом разгаре, дела идут неплохо

Умер многократный чемпион СССР и рекордсмен-конькобежец Юрий Сергеев

Волонтеры из Мытищ доставили помощь для медбатальона в зону СВО

Жительница Благовещенска обнаружила в ванной змею и вызвала спасателей

Экология в России и мире

Дистрибьюция Музыки.

Victoria`s Secret показал кампанию новой коллекции Dream

С 29 июля по 4 августа — Неделя популяризации грудного вскармливания

Гастроэнтеролог Садыков дал 3 совета, как не отравиться дыней и арбузом

Спорт в России и мире

Красноярка Мирра Андреева завоевала титул WTA и едет на Олимпиаду

Кафельников о поражении Андреевой на ОИ: это можно отнести к разряду сенсаций

Карлос Алькарас и Рафаэль Надаль выиграли первый матч на Олимпиаде в Париже

Гауфф вышла в третий круг на дебютной для себя Олимпиаде

Moscow.media

Утро в Кимже...

Идёт экстренная эвакуация: в Челябинской области прорвало дамбу

Штат консультантов 1C-практики «Борлас» вырос до 300 человек

Гора Нос











Топ новостей на этот час

Rss.plus






В Ярославле загорелся склад на площади в тысячу "квадратов"

Под ударом — каждый? Физик объяснил, как молния «выбирает» себе жертву

Надежность более 8 тысяч километров теплосетей проверили в Подмосковье с апреля

Реконструкция трамвайных путей от Ошарской до площади Лядова стартует 1 августа