Нов изкуствен интелект на Microsoft преобразува текст в жива реч за 3 секунди

Технологии

Обновена 09:00ч., 17.01.2023

Снимка: Shutterstock

Технолозите на Microsoft разкриха една от най-новите си разработки. Това е модел с изкуствен интелект (AI), наречен VALL-E, който е предназначен да преобразува текст в жива реч. Това не е първият модел от този вид, но ако алгоритъмът Lyrebird 2017, разработен в университета в Монреал, се нуждаеше от цяла минута запис за анализ, то моделът VALL-E се нуждае само от три секунди. След това започва да имитира речта на конкретен човек, включително акустична окраска и емоционалност на тона.

VALL-E е програмиран на 60 000 часа записи на реч на английски, предимно аудиокниги, четени от различни хора. Това даде своя резултат, моделът възпроизвежда изречения, които звучат напълно естествено.

Единственият недостатък на модела е, че прекъсва звука, когато в изреченията се появят неясни места от гледна точка на синтаксиса или пунктуацията. Моделът VALL-E също е много добър в пресъздаването на аудиосредата на оригиналния образец. Ако този образец, например, е записана от телефон, тогава цялата следваща синтезирана реч ще бъде "като от телефон". Също така моделът е в състояние да възпроизвежда тънкостите на речта, подобни образци, записани от американец или британец, дават напълно различни резултати.

Също така, моделът VALL-E е в състояние да придаде на речта емоционален характер. Може да предостави няколко примера на реч, отбелязани като ядосана, сънлива, изненадана, отвратена и т.н. Колкото повече такива образци се предоставят, толкова по-емоционална и естествена става синтезираната реч.

Последствията от подобни технологии са доста ясни. Положителната страна е, че можете да получите списък за пазаруване, озвучен от известен актьор, докато сте в супермаркета, или телефонът ви ще рецитира аудиокнига с глас, който отговаря на нейното съдържание, или дори с няколко гласа.

Но от лошата страна нещата изглеждат по-зле. Представете си измамник, който получава мостра от вашия глас и след това се обажда на близките ви роднини. Освен това с помощта на тази технология е възможно да се заобиколят системите за гласова идентификация, а фалшифициран запис на речта на всеки известен политик може да причини съкрушителен крах на кариерата му. И в заключение, трябва да се отбележи, че всички ние наскоро видяхме, че системите за изкуствен интелект като DALL-E, ChatGPT и други deepfake- технологии започват да се преместват от лабораториите в реалния свят. И тези промени, както обикновено, носят в същото време много нови рискове.

Ключови думи

Коментари

Няма въведени кометари.

Мениджър 03/2025

Нов изкуствен интелект на Microsoft преобразува текст в жива реч за 3 секунди

Свързани статии

Microsoft води преговори за инвестиция от 10 млрд. долара в компания за изкуствен интелект

Китай въвежда първите по рода си регулации на дийпфейк технологии

Свързани статии

Ключови думи

Коментари

ОЩЕ ОТ КАТЕГОРИЯТА

И създателят на OnlyFans се включва в наддаването за TikTok

Кога Европа ще има собствена алтернатива на Starlink?

Digital age: Техно пробиви и открития

Digital Age: Европейският акт за достъпност - ново начало за сайтовете и мобилните приложения?

Проучване: ИИ ще направи вашата компания по-силна, ако преди това не я убие

Бизнес перспективи: Надпреварата за ИИ превъзходство в Китай създава напрежение у дома

SERP Conf. Sofia 2025 събра елитът в областта на SEO, електроннната търговия и изкуствения интелект

Тръмп: Сделка с TikTok ще има преди крайния срок

С 9 лева поскъпват храните в потребителската кошница

Кристалина Георгиева: Американските мита представляват значителен риск за глобалните перспективи

Петролът върви към най-лошото си седмично представяне от месеци заради новите мита на САЩ

Посъветвали Тръмп да не разговаря с Путин, докато той не се съгласи на пълно прекратяване на огъня в Украйна

Конституционният съд на Южна Корея отстрани от длъжност президента Юн Сук-йол

Цитат на деня

Четири маркетингови тактики за малкия бизнес, които наистина работят

Визионер или динозавър

На днешната дата, 4 април. Рождениците днес

За да успеете сега, представете си края

САЩ забраниха на служителите в мисиите си в Китай да имат „романтични и сексуални“ връзки с местни граждани

Времето: Остава облачно с краткотрайни валежи следобед

Културни кодове: Можем ли да регулираме емоциите

Какво изнася България за САЩ и как ще ни засегнат новите мита?

ADVERTORIAL

Нестле и ЮНЕСКО стартират глобална инициатива за младежко овластяване и устойчиви хранителни системи

Фондация BCause стартира „Капка по капка“ за устойчив достъп до вода с подкрепата на JTI

Интегрирана здравна грижа от Хейлан

Събития на Мениджър 2025

2-ри годишен форум за транспорт, логистика и спедиция

Кейти Пери и Лорън Санчес ще летят в космоса в бляскави тоалети

Правилата на живота

Първите земеделци в Скандинавието са ликвидирали ловците събирачи преди 5900 години

Виц: Никога не дразни жена

Next level HR 2025

16-и зелен и енергиен форум

Кейти Пери и Лорън Санчес ще летят в космоса в бляскави тоалети

Правилата на живота

Първите земеделци в Скандинавието са ликвидирали ловците събирачи преди 5900 години

Виц: Никога не дразни жена