快訊 來源:證券時報網(wǎng) 2026-01-04 21:51:39
剛剛過去的2025年,是故宮博物院建院100周年。如今,這座濃縮了中華五千多年文明血脈的博物院不僅承載著厚重的歷史記憶,也在人工智能技術(shù)的加持下煥發(fā)出全新的活力。
近日,故宮博物院與火山引擎聯(lián)合推出“聽寶貝說”AI互動播客。這款A(yù)I應(yīng)用產(chǎn)品依托豆包大模型等AI技術(shù),用戶只需簡單跟讀一句話,即可生成個人音色的文物播客,用生動趣味的互動方式講述故宮文物的故事。即日起至2026年3月31日,用戶可在“故宮博物院”微信小程序中進行體驗。據(jù)了解,“聽寶貝說”AI播客重點面向親子陪伴場景,鼓勵家長與孩子共同錄制AI文物播客,在輕松的親子互動氛圍中,讓孩子更深刻地學(xué)習(xí)文物歷史故事。
當(dāng)百年故宮“遇上”豆包大模型,這一極具反差感的碰撞,是傳統(tǒng)文化與現(xiàn)代科技“雙向奔赴”的又一案例。行業(yè)分析指出,“科技+文化”的跨界合作,不僅有助于推動AI技術(shù)的普及,也將為傳統(tǒng)文化的傳承與傳播開辟了新路徑。
(資料圖)
故宮“煥新”,AI播客“講述”文物新故事
“北宋時期,有一位叫張擇端的畫家叔叔,他用他超級厲害的眼睛和畫筆,把一千年前開封城的熱鬧生活都畫下來……”這是一段用“聽寶貝說”AI互動播客生成的關(guān)于《清明上河圖》的個性化講解。用戶打開“聽寶貝說”AI互動播客,點擊“開始創(chuàng)作”,便可選擇一件感興趣的歷史文物,花十幾秒錄制一段自己的聲音后,一段以用戶聲音生成的關(guān)于該文物的講解作品便完成了。
甲骨、青銅、瓷器、書畫……故宮博物院的藏品涵蓋了我國古代各類藝術(shù)瑰寶。據(jù)了解,“聽寶貝說”從故宮190多萬件藏品中,精心遴選了從新石器時期到清朝不同歷史時期的30件代表性文物,深入挖掘背后的歷史內(nèi)涵和文化知識,并將其轉(zhuǎn)化為兒童也可以輕松理解的趣味性表達,為青少年提供了一個近距離感受故宮文物藏品的機會。
相比于聽老師和導(dǎo)游講解的傳統(tǒng)教育方式,“聽寶貝說”將文物故事轉(zhuǎn)化為一場充滿陪伴感與情感溫度的聲音互動。借助“聽寶貝說”AI播客,來自千百年前的故宮文物仿佛穿越時空,將文物知識轉(zhuǎn)化成了可感知的視聽語言,與孩子進行一場親密生動的對話。
AI賦能,大模型帶來知識探索新體驗
深奧專業(yè)的文物知識,如何在保證權(quán)威與嚴(yán)謹(jǐn)?shù)耐瑫r,轉(zhuǎn)化為生動有趣、可被青少年理解和接受的視聽語言?這背后離不開大模型技術(shù)的加持。
“講好文物故事需要專業(yè)的知識,故宮宣教老師會提供經(jīng)專家論證過的文物介紹。但這些專業(yè)科學(xué)的知識,小朋友往往聽不懂,因此要進行通俗化的改寫,這就需要故宮老師和豆包大模型共同完成?!被鹕揭嫖穆眯袠I(yè)總監(jiān)宋博文介紹,通過讓模型不斷學(xué)習(xí)和仿寫改寫后的通俗化版本,最終輸出兼具準(zhǔn)確性與口語化的結(jié)果。
在產(chǎn)品實測中,“聽寶貝說”AI播客可根據(jù)用戶錄制的聲音生成文物介紹,也引入了喜羊羊、熊大、熊二、光頭強、宮貓等多種音色,孩子可以選擇自己喜愛的角色來講文物故事。此外,用戶還可以選擇“小科普員”或“小歷史學(xué)家”等不同角色,生成相應(yīng)風(fēng)格的播客內(nèi)容。
這些功能的實現(xiàn),主要基于豆包大模型的多模態(tài)能力。據(jù)了解,“聽寶貝說”依托豆包聲音復(fù)刻模型2.0、豆包角色扮演模型。其中,豆包聲音復(fù)刻模型2.0基于全新的語音合成架構(gòu),從單純的聲線模仿進化到深度語義理解和情感表達,表現(xiàn)出更強的聲音表現(xiàn)力。用戶僅需跟讀一句話,豆包聲音復(fù)刻模型2.0即可在幾秒內(nèi)捕捉其聲音特征,生成融合其自身聲線的聲音,并可精準(zhǔn)解析文本情緒,表現(xiàn)出符合情緒的音色、語速和語調(diào)。豆包角色扮演模型則能夠精準(zhǔn)把握角色人設(shè),憑借強大的上下文感知與劇情推動能力,生成符合不同角色敘事風(fēng)格的播客腳本,讓知識探索變得如游戲般引人入勝。
科技助力,探索文物活化與文化傳承新可能
事實上,“聽寶貝說”AI播客并非故宮與火山引擎的首次合作。今年中秋,故宮博物院與火山引擎推出了AIGC視頻《故宮寶貝團圓夜》,依托豆包視頻生成模型和豆包圖像創(chuàng)作模型制作,運用影視級視頻生成技術(shù),讓文物在數(shù)字世界中“復(fù)活”。
據(jù)了解,火山引擎一直以來持續(xù)在科技助力文物活化與文化傳承方面進行探索。在數(shù)字文博領(lǐng)域,火山引擎利用AIGC技術(shù)繪制非遺百景圖,生動展現(xiàn)中國傳統(tǒng)技藝;與北京大學(xué)聯(lián)合研發(fā)的“識典古籍”平臺已開放超3萬部古籍;此外,還利用數(shù)字活化技術(shù)將山西高平二郎廟金代戲臺和北京正乙祠古戲樓等歷史建筑生成數(shù)字資產(chǎn),打造“虛擬直播間”,讓觀眾遠程“觸摸”歷史建筑,助力傳統(tǒng)戲劇的當(dāng)代傳播。
宋博文表示,火山引擎未來還將持續(xù)探索“AI+公共文化”的深度融合。目前,團隊正與部分博物館探索打造虛實融合的文物互動空間,游客通過虛擬現(xiàn)實設(shè)備,可在沉浸式場景中與數(shù)字形象對話。此外,團隊也在嘗試構(gòu)建專項知識智能體,如還原古代匠人聲音以講解工藝細節(jié),或讓用戶與古代書畫家進行跨時空藝術(shù)探討。這些腦洞大開的嘗試,正一步步將技術(shù)賦能文化傳承的想象變?yōu)楝F(xiàn)實。
標(biāo)簽: 財經(jīng)頻道 財經(jīng)資訊
免責(zé)聲明:市場有風(fēng)險,選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。