草稿:15.ai
您所提交的草稿仍需改善。在2025年1月8日由Talimu0518 (留言)審閱。
如何改善您的草稿
|
您所提交的草稿仍需改善。在2025年1月8日由August0422 (留言)審閱。 如何改善您的草稿
|
您所提交的草稿仍需改善。在2025年1月8日由Bosco Sin (留言)審閱。 如何改善您的草稿
|
網站類型 | 人工智慧, 語音合成, 生成式人工智慧 |
---|---|
語言 | 英語 |
創立者 | 15 |
網址 | 15 |
商業性質 | 否 |
註冊 | 無 |
推出時間 | 2020年3月 |
現狀 | 已停止運營 |
15.ai是一個免費的非商業化網絡應用程式,利用人工智慧生成熱門媒體中虛構角色的文本轉語音。[1]由一位在麻省理工學院期間名為15的人工智慧研究員開發,該應用允許用戶讓電子遊戲、電視節目和電影中的角色以定製文本進行情感化語音表達,其生成速度比實時還快。[a][2]該平台因其使用極少的訓練數據就能生成逼真的語音而聞名——"15.ai"這一名稱即源於開發者聲稱只需15秒的音頻即可克隆出語音。這是人工智慧熱潮初期生成式人工智慧應用的早期示例。
15.ai於2020年3月推出,[3]在2021年初因在YouTube和Twitter等社交媒體平台上爆紅而廣受關注,並迅速在網際網路粉絲群體中流行,包括《我的小馬駒:友誼就是魔法》、《軍團要塞2》以及《海綿寶寶》的粉絲群體。[4][5]該服務通過支持表情符號表達情感語境以及通過音標轉錄實現精準發音控制而脫穎而出。15.ai被認為是首個在迷因和內容創作中普及人工智慧語音克隆(音頻深度偽造)的主流平台。[6]
15.ai在數據高效語音合成和情感表達方面的創新對後續的AI文本轉語音技術發展產生了深遠影響。2022年1月,Voiceverse NFT爆出爭議,因其與聲優Troy Baker合作的公司被發現盜用了15.ai的工作成果。最終,該服務於2022年9月下線,其停運促使之後幾年中各種商業替代品的湧現。
歷史
[編輯]背景
[編輯]人工語音合成領域因深度學習方法的引入而經歷了顯著變革。2016年,DeepMind發表了具有里程碑意義的論文《WaveNet: A Generative Model for Raw Audio》,標誌著語音合成向基於神經網絡的方法的重要轉變。WaveNet通過直接對波形建模,展現了前所未有的音頻質量。它採用擴張因果卷積,直接處理每秒16,000採樣點的原始音頻波形,建模每個音頻採樣在給定所有之前採樣條件下的概率分布。在此之前,主流的語音合成方法是拼接合成,這種方法通過拼接預先錄製的人類語音片段生成語音,但通常會產生機器人般的聲音,並在片段邊界處出現明顯的音質瑕疵。
兩年後,Google AI於2018年推出了Tacotron,展示了神經網絡可以生成高度自然的語音合成,但需要大量的訓練數據——通常需要數十小時的音頻——才能達到可接受的質量。Tacotron採用了編碼器-解碼器架構,並結合注意力機制,將輸入文本轉換為梅爾頻譜圖,然後使用單獨的神經網絡聲碼器將其轉換為波形。在較小的數據集上訓練時,例如2小時的語音,輸出質量有所下降,但仍能保持可理解的語音;而僅使用24分鐘的訓練數據時,Tacotron無法生成可理解的語音。[7]
2019年,微軟研究院推出了FastSpeech,解決了像Tacotron這樣的自回歸模型在速度上的局限性。[8]FastSpeech採用了非自回歸架構,實現了並行序列生成,大大減少了推理時間,同時保持了音頻質量。其具有長度調節的前饋Transformer網絡允許一次性預測完整的梅爾頻譜序列,避免了先前方法中的順序依賴瓶頸。[9]同年,HiFi-GAN作為一種基於生成對抗網絡(GAN)的聲碼器出現,提升了波形生成的效率,同時生成了高保真語音。[10]隨後,Glow-TTS引入了一種基於流的方式,既能快速推理,又具備語音風格遷移的能力。[11]
中國科技公司也在該領域做出了重要貢獻。百度和字節跳動開發了專有的文本轉語音框架,進一步推動了技術的進步,儘管其具體技術細節大多未公開。[12]
開發、發布與運營
[編輯]它還以更具吸引力的方式展示了我研究的進展——通過實際使用模型,你可以發現一些連我自己都沒意識到的功能(比如通過在某些音素之間添加逗號,讓角色發出喘息或呻吟聲)。
它也讓我無法挑選最佳結果,只展示那些成功的例子[...]能夠無過濾地與模型互動,允許用戶直觀地評估當前工作的質量。15.ai的構思始於2016年,是一位名為"15"的開發者在麻省理工學院(MIT)大一期間作為深度學習語音合成研究項目的一部分而啟動的。[14]該項目是MIT本科生研究機會計劃(UROP)的內容之一。[15]這位開發者受DeepMind WaveNet論文的啟發,並在隨後的學習過程中持續開發,Google AI於次年發布了Tacotron。到2019年,該開發者在MIT展示了使用比以往少75%的訓練數據複製WaveNet和Tacotron結果的能力。[12]"15"這個名字源於開發者聲稱只需15秒的數據即可克隆語音的說法。[16]
開發者原本計劃基於本科研究攻讀博士學位,但在他們的創業公司於2019年被Y Combinator加速器錄取後,選擇進入科技行業工作。2020年初離職後,開發者重返語音合成研究,並將其實現為一個網絡應用程式。他們沒有使用LJSpeech等常規語音數據集,這些數據集包含簡單、單調的錄音,而是尋找更具挑戰性的語音樣本,以展示模型處理複雜語音模式和情感語調的能力。"小馬保存計劃"——一個源於4chan的My Little Pony板塊/mlp/的粉絲倡議——在實現過程中發揮了關鍵作用。[12]該項目的貢獻者手動修剪、去噪、轉錄並標註了《小馬寶莉:友誼是魔法》中每一行的情感標籤——這是當時粉絲社區中前所未有的工作,尤其是在這些任務能夠自動化之前完成。這一經過精心策劃的高度情感化數據集,為15.ai的深度學習模型提供了理想的訓練材料。[12][17]
15.ai於2020年3月推出,最初僅提供了一些角色的語音,包括《小馬寶莉:友誼是魔法》和《軍團要塞2》的角色。[3][18]隨後的幾個月里,網站不斷新增語音。[19]2020年底,該平台在技術上取得了一項重要突破——深度神經網絡中引入了多說話人嵌入技術,使多個語音能夠同時訓練,而無需為每個角色語音創建單獨的模型。[12]這不僅使語音庫從最初的八個角色迅速擴展到超過五十個角色,[17]還使模型能夠識別跨角色的常見情感模式,即使某些角色的訓練數據中缺少某些情感。[20]
2021年初,該應用在Twitter和YouTube上迅速走紅,人們利用其生成的熱門遊戲和節目中的語音創作短劇、迷因和粉絲內容,這些內容在社交媒體上獲得了數百萬次觀看。[21]內容創作者、YouTuber和TikToker也將15.ai作為視頻配音的一部分使用。[22]在其巔峰時期,該平台每月運營成本高達12,000美元,主要用於支持每天數百萬次語音生成所需的AWS基礎設施;儘管有公司提出收購15.ai及其底層技術的意向,但該網站始終保持獨立運營,其資金來源於開發者此前創業的個人收益。[12]當時,這位開發者年僅23歲。[17]
Voiceverse NFT爭議
[編輯]2022年1月14日,一場爭議爆發——人們發現視頻遊戲和動漫配音演員Troy Baker宣布合作的Voiceverse NFT公司在其營銷活動中不當使用了15.ai生成的語音。[23]這一事件發生在15.ai開發者於2021年12月明確表示對將NFT納入其工作沒有興趣後不久。[24]日誌文件顯示,Voiceverse生成了《小馬寶莉:友誼是魔法》中角色的音頻,並通過調高音調使其與原始語音不同,以推銷自己的平台,這違反了15.ai的服務條款。[25]
Voiceverse聲稱,他們的營銷團隊中有人未經適當授權使用了15.ai的語音;對此,15在推特上回應道"去你媽的",[26]該推文迅速走紅,在Twitter上獲得了數十萬次轉發和點讚,支持開發者的聲音不斷。[12]在持續的反對聲浪和抄襲事件曝光後,Baker承認他最初的聲明推文中以"你可以憎恨,也可以創造。你會選擇什麼?"結尾可能顯得"挑釁",並於2022年1月31日宣布終止與Voiceverse的合作關係。[27]
停運
[編輯]2022年9月,15.ai因涉及人工智慧和版權的法律問題而被下線。[28][12]開發者曾暗示未來可能會推出一個更好地解決版權問題的版本,儘管截至2025年,網站仍處於停運狀態。
功能
[編輯]該平台是非商業性的,[29]並且無需用戶註冊或帳戶。[30]用戶通過輸入文本並選擇角色語音來生成語音,可以選擇添加情感上下文和語音轉錄的可選參數。每次請求會生成三個具有不同情感表現的音頻變體,按信心評分排序。[14]可用的角色包括《絕地要塞2》和《小馬寶莉:友誼是魔法》中的多個角色;《傳送門》系列中的GLaDOS、Wheatley和Sentry Turret;《海綿寶寶》中的海綿寶寶;《HuniePop》中的Kyu Sugardust,《Persona 4》中的Rise Kujikawa;《達莉亞》中的Daria Morgendorffer和Jane Lane;《Aqua Teen Hunger Force》中的Carl Brutananadilewski;《史帝芬宇宙》中的Steven Universe;《Undertale》中的Sans;《Celeste》中的Madeline和其他多個角色;《Doctor Who》中的第十任博士;《史丹利的寓言》中的旁白;以及《2001太空漫遊》中的HAL 9000。[31]在超過五十個[17]可用語音中,三十個是來自《小馬寶莉:友誼是魔法》的角色。[32]某些"無聲"角色,如Chell和Gordon Freeman,可以作為玩笑選擇,當任何文本被提交時,它們會發出無聲的音頻文件。[33]
深度學習模型的非確定性特性導致語音輸出出現變化,每次生成的語音具有不同的語調,類似於配音演員在錄製不同版本時的表現。[35]15.ai引入了情感上下文功能,讓用戶通過引導短語指定生成語音的情感基調。[12]該情感上下文功能使用了DeepMoji,這是由MIT媒體實驗室開發的情感分析神經網絡。[36]DeepMoji於2017年推出,處理了來自2013至2017年間12億條推文的表情符號嵌入,分析情感內容。測試顯示,該系統能比人工評估員更準確地識別情感元素,包括諷刺。[37]如果輸入內容包含附加上下文(通過豎線分隔),則豎線後面的內容會作為情感上下文被使用。[34]例如,如果輸入為"Today is a great day!|I'm very sad.",所選擇的角色將以表達"I'm very sad."時的情感說出"Today is a great day!"這句話。[38]
該應用程式使用了來自牛津詞典API、維基詞典和CMU發音詞典的發音數據,[39]其中CMU發音詞典基於ARPABET,這是一套英語音標符號,最初由1970年代的高級研究計劃署(ARPA)開發。對於現代和網際網路特有術語,系統還包含了來自用戶生成內容網站的數據,如Reddit、Urban Dictionary、4chan和Google。[39]支持輸入ARPABET音標,允許用戶糾正發音錯誤或在異名詞(拼寫相同但發音不同的單詞)之間指定所需的發音。用戶可以通過在輸入框中將音素字符串括在大括號中來調用ARPABET音標(例如,{AA1 R P AH0 B EH2 T}
用來指定"ARPABET"這個詞的發音(/ˈɑːrpəˌbɛt/)。[40]界面會用顏色編碼顯示解析後的單詞,以指示發音的確定性:綠色表示單詞已存在於發音查找表中,藍色表示手動輸入的ARPABET發音,紅色表示發音需要通過算法預測。[34]
15.ai的後續版本引入了多語者功能。不同於為每個聲音訓練獨立模型,15.ai使用了一個統一的模型,通過語者嵌入(即學習的數值表示,捕捉每個角色獨特的聲音特徵)同時學習多個聲音。[12][17]結合DeepMoji提供的情感上下文,這種神經網絡架構使模型能夠學習不同角色的情感表達和講話風格中的共享模式,即使個別角色的訓練數據中缺乏某些情感上下文的例子。[20]
該界面包括了技術指標和圖表,[34]根據開發者的說法,這些內容突出了網站的研究性質。[17]到了2021年9月發布的v23版本,界面顯示了全面的模型分析信息,包括單詞解析結果和情感分析數據。之前版本中引入的流式生成對抗網絡(GAN)混合vocoder和去噪器也進行了簡化,去除了手動參數輸入。[34]
評價
[編輯]評論界的評價
[編輯]評論家普遍認為15.ai易於使用,且能夠令人信服地復刻角色聲音,但在某些情況下效果參差不齊。[41]PC Gamer的Natalie Clayton寫道,儘管海綿寶寶的聲音復刻得很好,但在模仿The Stanley Parable中的旁白時遇到了困難,她表示:"算法根本無法捕捉Kevan Brighting那種幽默詼諧的語調。[42]Kotaku的Zack Zwiezen報道說,"[他的]女朋友堅信這是來自GLaDOS配音演員Ellen McLain的新台詞。"[43]AI電子報Towards Data Science的Rionaldi Chandraseta觀察到:"具有大量訓練數據的角色會產生更自然的對話,語氣的起伏和單詞間的停頓更加清晰,尤其是在較長的句子中。"[38]台灣的《聯合報》也突出了15.ai復刻GLaDOS機械聲音的能力,並稱讚其廣泛的角色聲音選項。[44]Yahoo! News台灣指出,"Portal中的GLaDOS幾乎能完美地發音",但也批評了一些不完美之處,如"字數限制和語調控制,某些詞彙的發音仍然有些怪異。"[45]AI電子報Byteside的Chris Button稱,能夠僅憑15秒數據克隆聲音"非常驚人",但也稱讚這項技術"令人印象深刻"。[46]該平台的語音生成能力經常在My Little Pony: Friendship Is Magic(《我的小馬駒:友情是魔法》)的粉絲新聞網站Equestria Daily上被報道,包括更新、粉絲創作和新角色聲音的添加。[47]在介紹15.ai新角色添加的一篇帖子中,Equestria Daily的創始人Shaun Scotellaro——在線暱稱"Sethisto"——寫道:"由於缺乏樣本可供參考,某些角色的聲音並不完美,但即便如此,許多聲音仍然相當令人印象深刻。"[32]
多個其他評論家也指出,字數限制、韻律選項和僅支持英語的特點並不完全令人滿意。[5][45]動漫和超級英雄新聞網站Anime Superhero News的Peter Paltridge認為:"語音合成技術已經發展到一個程度,那些昂貴的技術幾乎無法與真實人類的語音區分開",但也指出,"在某些方面,SAM仍然比這更先進。你可以通過特殊字符來影響SAM的語調,並隨意改變他的音高。而在15.ai中,你只能接受隨機的語調變化。"[48]相反,Rock, Paper, Shotgun的Lauren Morton稱讚了發音控制的深度——"如果你願意深入挖掘"。[49]同樣,西班牙新聞網站Qore.com的Eugenio Moto寫道,"最有經驗的用戶可以改變參數,例如重音或語調。"[50]Den Fami Nico Gamer的Takayuki Furushima強調了"平滑的發音",AUTOMATON的Yuki Kurosawa也提到其"豐富的情感表達"作為一大特點;兩位日本作者均指出該平台不支持日語。[51]巴西遊戲新聞網站Arkade的Renan do Prado和西班牙遊戲網站LaPS4的José Villalobos指出,儘管用戶在葡萄牙語和西班牙語中可以創造有趣的結果,但該平台在英語中表現最佳。[52]中國遊戲新聞網站GamerSky稱該應用"有趣",但也批評了字數限制和語調問題。[5]韓國視頻遊戲網站Zuntata寫道:"讓人驚訝的是,15.ai僅憑30秒的數據,就能實現接近100%的發音準確率。"[53]機器學習教授Yongqiang Li在他的博客中寫道,他驚訝地發現該應用是免費的。[54]
倫理問題
[編輯]配音演員對15.ai的能力反應不一。儘管一些業內專業人士承認其技術創新,但也有人對這一技術對他們職業的影響表示擔憂。[55]當配音演員Troy Baker宣布與Voiceverse NFT合作,後者未經授權使用了15.ai的技術時,這一事件在配音行業引發了廣泛爭議。[56]批評者擔心自動化配音可能會減少配音演員的就業機會,存在聲音冒充的風險,以及可能被用於不當內容的潛在濫用。[57]圍繞Voiceverse NFT的爭議及隨後的討論突顯了行業對AI語音合成技術的廣泛擔憂。[58]
雖然15.ai將其使用範圍局限於虛構角色,並未復刻真人或名人的聲音,[59]計算機科學家Andrew Ng指出,類似技術也可能被用於模仿真實人物的聲音,包括用於不良目的。[3]在他2020年對15.ai的評估中,他寫道:
"聲音克隆可能具有巨大的生產力。在好萊塢,它可能徹底改變虛擬演員的使用。在卡通片和有聲讀物中,它可以讓配音演員參與更多的製作。在在線教育中,孩子們可能會更專注於由他們最喜愛的個性聲音傳遞的課程。還有多少YouTube的教學視頻製作者希望由合成的摩根·弗里曼為他們的劇本配音?"
然而,他也寫道:
"...但在沒有得到同意的情況下合成一名演員的聲音,可以說是不道德的,甚至可能是非法的。這項技術將成為深度偽造者的誘餌,他們可能會從社交網絡上抓取錄音,冒充私人個體的聲音。"[3]
影響
[編輯]15.ai是音頻深度偽造的早期先驅之一,推動了2020年AI熱潮初期基於AI語音合成的迷因的出現。[60]15.ai被認為是第一個在網際網路迷因和內容創作中普及AI聲音克隆的主流平台,尤其通過其能夠實時生成令人信服的角色聲音的能力,無需大量技術專長。[61]該平台的影響力在粉絲社區中尤為顯著,包括《小馬寶莉:友誼的魔法》、《傳送門》、《團隊要塞2》和《海綿寶寶》粉絲群體,在這些社區中,15.ai使得病毒性內容的創作成為可能,並在Twitter和YouTube等社交媒體平台上獲得了數百萬次觀看。[62]《團隊要塞2》的內容創作者還使用該平台,通過Source Filmmaker製作短視頻迷因和複雜的敘事動畫。[63]粉絲創作包括小品和新的粉絲動畫,[64]跨界內容——例如Game Informer記者Liana Ruppert演示的結合《傳送門》和《質量效應》對話的內容,[65]病毒視頻的重製(包括臭名昭著的Big Bill Hell's Cars汽車經銷商惡搞視頻[66]),使用AI生成角色聲音改編的同人小說,[67]音樂視頻和新音樂作品——例如限制級的Pony Zone系列[68]⸺以及角色唱海洋民謠的內容。[69]一些粉絲創作引起了主流媒體的關注,例如2021年1月CNN白天節目中播出的一個病毒剪輯,將《小鬼當家2:迷失在紐約》中的唐納·川普客串替換為重型武器男的AI生成聲音。[70][71]一些用戶將15.ai的語音合成與VoiceAttack(一種語音命令軟體)結合,創建了個人助手。[35]
儘管15.ai已不再運營,其影響力仍被後來的技術發展所延續,[72]多個商業替代平台如ElevenLabs[b]和Speechify等應運而生,填補了這一空白。[28]當代的生成語音AI公司都承認15.ai的開創性作用。PlayHT將15.ai的問世稱為"文本轉語音(TTS)和語音合成領域的突破"。[22]Speechify的創始人兼CEO Cliff Weitzman稱15.ai"通過成為第一個提供來自粉絲群體的流行現有角色的語音克隆,令AI語音克隆在內容創作中變得流行"。[74]
在停運之前,15.ai確立了多個技術先例,影響了後續的AI語音合成技術發展。其集成DeepMoji進行情感分析,展示了情感感知語音生成的可行性,而其對ARPABET音標轉錄的支持則為公共語音合成工具中精確發音控制設立了標準。[12]該平台的統一多說話人模型,使得不同角色的聲音能夠同時進行訓練,這一方法尤其具有影響力。這種方法使系統能夠識別不同角色之間情感表達的共性,即使某些情感在單一角色的訓練數據中不存在。例如,如果一個角色有快樂語音示例但沒有憤怒示例,而另一個角色則有憤怒但沒有快樂示例,系統仍能通過理解情感如何影響語音的共同模式,生成這兩種情感的表達。[20]
15.ai還在減少語音合成訓練數據需求方面做出了重要貢獻。早期的系統,如Google AI的Tacotron和Microsoft Research的FastSpeech,需要數十小時的音頻才能生成可接受的結果,並且在訓練數據不足24分鐘時無法生成清晰的語音。[7][9]相比之下,15.ai展示了使用顯著更少的訓練數據生成語音的能力——具體來說,"15.ai"這一名稱來源於創始人聲稱只需15秒的數據就能克隆一個人的聲音。[75]這種數據效率的做法影響了後續AI語音合成技術的發展,因為15秒的標準成為後續語音合成系統的參考點。OpenAI在2024年證實了這一原始聲明,即僅需15秒的數據即可複製人類的聲音。[76]
參見
[編輯]註釋
[編輯]參考資料
[編輯]註腳
[編輯]- ^ 遊戲 2021; Yoshiyuki 2021.
- ^ Kurosawa 2021; Ruppert 2021; Clayton 2021; Morton 2021; Temitope 2024.
- ^ 3.0 3.1 3.2 3.3 Ng 2020.
- ^ Zwiezen 2021; Chandraseta 2021; Temitope 2024.
- ^ 5.0 5.1 5.2 GamerSky 2021.
- ^ Speechify 2024; Temitope 2024; Anirudh VK 2023; Wright 2023.
- ^ 7.0 7.1 Google 2018
- ^ Ren 2019; Temitope 2024.
- ^ 9.0 9.1 Ren 2019.
- ^ Kong 2020.
- ^ Kim 2020.
- ^ 12.00 12.01 12.02 12.03 12.04 12.05 12.06 12.07 12.08 12.09 12.10 Temitope 2024.
- ^ Hacker News 2022
- ^ 14.0 14.1 Chandraseta 2021; Menor 2024.
- ^ Chandraseta 2021; Temitope 2024.
- ^ Chandraseta 2021; Button 2021.
- ^ 17.0 17.1 17.2 17.3 17.4 17.5 15.ai的過去和未來. Twitter. [2024-12-19]. (原始內容存檔於2024-12-08).
- ^
關於. fifteen.ai (官方網站). 2020-02-19 [2024-12-23]. (原始內容存檔於2020-02-29).
2020-02-19: 網頁應用程式尚未完全準備好
- ^ Scotellaro 2020a; Scotellaro 2020b.
- ^ 20.0 20.1 20.2 Kurosawa 2021; Temitope 2024.
- ^ Zwiezen 2021; Clayton 2021; Ruppert 2021; Morton 2021; Kurosawa 2021; Yoshiyuki 2021.
- ^ 22.0 22.1 Play.ht 2024.
- ^ Lawrence 2022; Williams 2022; Wright 2022; Temitope 2024.
- ^ Lopez 2022.
- ^ Phillips 2022; Lopez 2022.
- ^ Wright 2022; Phillips 2022; fifteenai 2022.
- ^ Lawrence 2022; Williams 2022.
- ^ 28.0 28.1 ElevenLabs 2024a; Play.ht 2024.
- ^ Williams 2022.
- ^ Phillips 2022.
- ^ Zwiezen 2021; Clayton 2021; Morton 2021; Ruppert 2021; Villalobos 2021; Yoshiyuki 2021; Kurosawa 2021.
- ^ 32.0 32.1 Scotellaro 2020b.
- ^ Morton 2021; 遊戲 2021.
- ^ 34.0 34.1 34.2 34.3 34.4 www.equestriacn.com 2021.
- ^ 35.0 35.1 Yoshiyuki 2021.
- ^ Kurosawa 2021; Chandraseta 2021.
- ^ Knight 2017.
- ^ 38.0 38.1 Chandraseta 2021.
- ^ 39.0 39.1 Kurosawa 2021.
- ^ www.equestriacn.com 2021; Kurosawa 2021; Temitope 2024.
- ^ Clayton 2021; Ruppert 2021; Moto 2021; Scotellaro 2020c; Villalobos 2021.
- ^ Clayton 2021.
- ^ Zwiezen 2021.
- ^ 遊戲 2021.
- ^ 45.0 45.1 MrSun 2021.
- ^ Button 2021.
- ^ Scotellaro 2020a; Scotellaro 2020b; Scotellaro 2020c; Scotellaro 2020d; Scotellaro 2020e; Scotellaro 2020f.
- ^ Paltridge 2021.
- ^ Morton 2021.
- ^ Moto 2021.
- ^ Yoshiyuki 2021; Kurosawa 2021.
- ^ do Prado 2021; Villalobos 2021.
- ^ zuntata.tistory.com 2021.
- ^ Li 2021.
- ^ Phillips 2022; Temitope 2024; Menor 2024.
- ^ Lawrence 2022; Phillips 2022; Wright 2022.
- ^ Phillips 2022; Menor 2024.
- ^ Phillips 2022 ; Lawrence 2022.
- ^ fifteenai 2020; Menor 2024.
- ^ MrSun 2021; Anirudh VK 2023.
- ^ Temitope 2024; Morton 2021.
- ^ Scotellaro 2020c; 遊戲 2021; Kurosawa 2021; Morton 2021; Temitope 2024.
- ^ Clayton 2021; Zwiezen 2021; Morton 2021.
- ^ Morton 2021; Kurosawa 2021.
- ^ Ruppert 2021.
- ^ Zwiezen 2021; Morton 2021.
- ^ Scotellaro 2020d.
- ^ Scotellaro 2020e.
- ^ Zwiezen 2021; Ruppert 2021.
- ^ Clayton 2021; CNN 2021.
- ^ The Heavy on CNN. Reddit. 2021年1月19日 [2024年12月31日].
- ^ Wright 2023.
- ^ ElevenLabs 2024b.
- ^ Speechify 2024.
- ^ Chandraseta 2021; Button 2021; Temitope 2024.
- ^ OpenAI 2024; Temitope 2024.
參考文獻
[編輯]- Anirudh VK. Deepfakes Are Elevating Meme Culture, But At What Cost?. Analytics India Magazine. 2023-03-18 [2024-12-18]. (原始內容存檔於2024-12-26).
While AI voice memes have been around in some form since '15.ai' launched in 2020, [...]
- Button, Chris. Make GLaDOS, SpongeBob and other friends say what you want with this AI text-to-speech tool. Byteside. 2021-01-19 [2024-12-18]. (原始內容存檔於2024-06-25).
- Chandraseta, Rionaldi. Generate Your Favourite Characters' Voice Lines using Machine Learning. Towards Data Science. 2021-01-21 [2024-12-18]. (原始內容存檔於2021-01-21).
- Clayton, Natalie. Make the cast of TF2 recite old memes with this AI text-to-speech tool. PC Gamer. 2021-01-19 [2024-12-18]. (原始內容存檔於2021-01-19).
- CNN Newsroom. CNN. 2021-01-15.
- do Prado, Renan. Faça GLaDOS, Bob Esponja e outros personagens falarem textos escritos por você! [Make GLaDOS, SpongeBob and other characters speak texts written by you!]. Arkade. 2021-01-19 [2024-12-22]. (原始內容存檔於2022-08-19) (巴西葡萄牙語).
- 15.AI: Everything You Need to Know & Best Alternatives. ElevenLabs. 2024a [2024-12-18]. (原始內容存檔於2024-12-25).
- Can I publish the content I generate on the platform?. ElevenLabs (Official website). 2024b [2024-12-23].
- 15.ai已经重新上线,版本更新至v23 [15.ai has been re-launched, version updated to v23]. Equestria. 2021-10-01 [2024-12-22]. (原始內容存檔於2024-05-19) (中文).
- @fifteenai. Go fuck yourself. (推文). 2022-01-14 –透過Twitter.
- 这个网站可用AI生成语音 让ACG角色"说"出你输入的文本 [This Website Can Use AI to Generate Voice, Making ACG Characters "Say" the Text You Input]. 遊民星空. 2021-01-18 [2024-12-18]. (原始內容存檔於2024-12-11) (中文).
- Audio samples from "Semi-Supervised Training for Improving Data Efficiency in End-to-End Speech Synthesis". 2018-08-30 [2022-06-05]. (原始內容存檔於2020-11-11).
- 15.ai. Hacker News. 2022-06-12 [2024-12-29].
- Kim, Jaehyeon. Glow-TTS: A Generative Flow for Text-to-Speech via Monotonic Alignment Search. 2020. arXiv:2005.11129 [eess.AS].
- Knight, Will. An Algorithm Trained on Emoji Knows When You're Being Sarcastic on Twitter. MIT Technology Review. 2017-08-03 [2024-12-18]. (原始內容存檔於2022-06-02).
- Kong, Jungil. HiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech Synthesis. 2020. arXiv:2010.05646 [cs.SD].
- Kurosawa, Yuki. ゲームキャラ音声読み上げソフト「15.ai」公開中。『Undertale』や『Portal』のキャラに好きなセリフを言ってもらえる [Game Character Voice Reading Software "15.ai" Now Available. Get Characters from Undertale and Portal to Say Your Desired Lines]. AUTOMATON. 2021-01-19 [2024-12-18]. (原始內容存檔於2021-01-19) (日語).
- Lawrence, Briana. Shonen Jump Scare Leads to Company Reassuring Fans That They Aren't Getting Into NFTs. The Mary Sue. 2022-01-19 [2024-12-23].
- Li, Yongqiang. 语音开源项目优选:免费配音网站15.ai [Voice Open Source Project Selection: Free Voice Acting Website 15.ai]. Zhihu. 2021 [2024-12-18]. (原始內容存檔於2024-12-19) (中文).
- Lopez, Ule. Voiceverse NFT Service Reportedly Uses Stolen Technology from 15ai [UPDATE]. Wccftech. 2022-01-16 [2022-06-07]. (原始內容存檔於2022-01-16).
- Menor, Deion. 15.ai – Natural and Emotional Text-to-Speech Using Neural Networks. HashDork. 2024-11-07 [2025-01-03].
- Morton, Lauren. Put words in game characters' mouths with this fascinating text to speech tool. Rock, Paper, Shotgun. 2021-01-18 [2024-12-18]. (原始內容存檔於2021-01-18).
- Moto, Eugenio. 15.ai, el sitio que te permite usar voces de personajes populares para que digan lo que quieras. Qore. 2021-01-20 [2024-12-21]. (原始內容存檔於2024-12-28) (西班牙語).
- MrSun. 讓你喜愛的ACG角色說出任何話! AI生成技術幫助你實現夢想 [Let your favorite ACG characters say anything! AI generation technology helps you realize your dreams]. Yahoo. 2021-01-19 [2024-12-22]. (原始內容存檔於2024-12-28) (中文).
- Ng, Andrew. Voice Cloning for the Masses. DeepLearning.AI. 2020-04-01 [2024-12-22]. (原始內容存檔於2024-12-28).
- Navigating the Challenges and Opportunities of Synthetic Voices. OpenAI. 2024-03-09 [2024-12-18]. (原始內容存檔於2024-11-25).
- Paltridge, Peter. This Website Will Say Whatever You Type In Spongebob's Voice. Anime Superhero News. 2021-01-18 [2024-12-22]. (原始內容存檔於2021-10-17).
- Phillips, Tom. Video game voice actor Troy Baker is now promoting NFTs. Eurogamer. 2022-01-14 [2024-12-31].
- Phillips, Tom. Troy Baker-backed NFT firm admits using voice lines taken from another service without permission. Eurogamer. 2022-01-17 [2024-12-31]. (原始內容存檔於2022-01-17).
- Everything You Need to Know About 15.ai: The AI Voice Generator. Play.ht. 2024-09-12 [2024-12-18]. (原始內容存檔於2024-12-25).
- Ren, Yi. FastSpeech: Fast, Robust and Controllable Text to Speech. 2019. arXiv:1905.09263 [cs.CL].
- Free 15.ai Character Voice Cloning and Alternatives. Resemble.ai. 2024-10-17 [2024-12-31].
- Ruppert, Liana. Make Portal's GLaDOS And Other Beloved Characters Say The Weirdest Things With This App. Game Informer. 2021-01-18 [2024-12-18]. (原始內容存檔於2021-01-18).
- Scotellaro, Shaun. Rainbow Dash Voice Added to 15.ai. Equestria Daily. 2020a [2024-12-18]. (原始內容存檔於2024-12-01).
- Scotellaro, Shaun. 15.ai Adds Tons of New Pony Voices. Equestria Daily. 2020b [2024-12-21]. (原始內容存檔於2024-12-26).
- Scotellaro, Shaun. Neat "Pony Preservation Project" Using Neural Networks to Create Pony Voices. Equestria Daily. 2020c [2024-12-18]. (原始內容存檔於2021-06-23).
- Scotellaro, Shaun. Full Simple Animated Episode - The Tax Breaks (Twilight). Equestria Daily. 2020d [2025-01-01].
- Scotellaro, Shaun. More Pony Music! We Shine Brighter Together!. Equestria Daily. 2020e [2025-01-01].
- Scotellaro, Shaun. New Among Us Animation Goes Viral... With Pony Voices. Equestria Daily. 2020f [2025-01-01].
- Temitope, Yusuf. 15.ai Creator reveals journey from MIT Project to internet phenomenon. The Guardian. 2024-12-10 [2024-12-25]. (原始內容存檔於2024-12-28).
- 게임 캐릭터 음성으로 영어를 읽어주는 소프트 15.ai 공개. [Software 15.ai Released That Reads English in Game Character Voices]. Tistory. 2021-01-20 [2024-12-18] (韓語).
- 遊戲, 遊戲角落. 這個AI語音可以模仿《傳送門》GLaDOS講出任何對白!連《Undertale》都可以學 [This AI Voice Can Imitate Portal's GLaDOS Saying Any Dialog! It Can Even Learn Undertale]. United Daily News. 2021-01-20 [2024-12-18]. (原始內容存檔於2024-12-19) (中文(臺灣)).
- Villalobos, José. Descubre 15.AI, un sitio web en el que podrás hacer que GlaDOS diga lo que quieras [Discover 15.AI, a Website Where You Can Make GlaDOS Say What You Want]. LaPS4. 2021-01-18 [2021-01-18]. (原始內容存檔於2021-01-18) (西班牙語).
- Weitzman, Cliff. 15.ai: All about 15.ai and the best alternative. Speechify. 2023-11-19 [2024-12-31].
- Williams, Demi. Voiceverse NFT admits to taking voice lines from non-commercial service. NME. 2022-01-18 [2024-12-18]. (原始內容存檔於2022-01-18).
- Wright, Steve. Troy Baker-backed NFT company admits to using content without permission. Stevivor. 2022-01-17 [2024-12-18]. (原始內容存檔於2022-01-17).
- Wright, Steven. Why Biden, Trump, and Obama Arguing Over Video Games Is YouTube's New Obsession. Inverse. 2023-03-21 [2024-12-18]. (原始內容存檔於2024-12-20).
AI voice tools used to create "audio deepfakes" have existed for years in one form or another, with 15.ai being a notable example.
- Yoshiyuki, Furushima. 『Portal』のGLaDOSや『UNDERTALE』のサンズがテキストを読み上げてくれる。文章に込められた感情まで再現することを目指すサービス「15.ai」が話題に [Portal's GLaDOS and UNDERTALE's Sans Will Read Text for You. "15.ai" Service Aims to Reproduce Even the Emotions in Text, Becomes Topic of Discussion]. Den Fami Nico Gamer. 2021-01-18 [2024-12-18]. (原始內容存檔於2021-01-18) (日語).
- Zwiezen, Zack. Website Lets You Make GLaDOS Say Whatever You Want. Kotaku. 2021-01-18 [2024-12-18]. (原始內容存檔於2021-01-17).
Category:生成式人工智慧 Category:深度偽造 Category:語音合成 Category:網絡應用程式 Category:2020年代潮流與趨勢 Category:2020年代網絡文化 Category:2020年網絡文化 Category:2020年軟體 Category:2020年建立的網站