91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

微軟新探索:音生圖AI,實(shí)時(shí)視覺(jué)化會(huì)議演講場(chǎng)景?

   發(fā)布時(shí)間:2024-10-15 13:26 作者:楊凌霄

近日,科技媒體MSPoweruser發(fā)布報(bào)道,透露微軟公司新獲一項(xiàng)創(chuàng)新專利,該專利描述了一種基于用戶實(shí)時(shí)語(yǔ)音輸入來(lái)生成圖片的技術(shù)。

據(jù)悉,這項(xiàng)專利文件長(zhǎng)達(dá)20頁(yè),微軟于2023年4月5日提交申請(qǐng),并于10月10日獲得批準(zhǔn)。根據(jù)專利的詳細(xì)描述,該系統(tǒng)能夠在會(huì)議或講座等場(chǎng)合實(shí)時(shí)捕捉音頻內(nèi)容,隨后利用語(yǔ)言模型對(duì)這些音頻進(jìn)行總結(jié),并據(jù)此生成相應(yīng)的AI圖像。

該專利所描述的工作流程分為三個(gè)主要步驟:首先是捕捉音頻,即用戶通過(guò)麥克風(fēng)發(fā)言,系統(tǒng)實(shí)時(shí)記錄并將其轉(zhuǎn)化為文本;其次是處理文本,系統(tǒng)將文本分段記錄,并對(duì)每段內(nèi)容通過(guò)語(yǔ)言模型進(jìn)行總結(jié);最后是生成圖像,系統(tǒng)根據(jù)總結(jié)生成的提示,創(chuàng)建AI生成的圖像,并在屏幕上實(shí)時(shí)顯示。

預(yù)計(jì)這一功能將主要應(yīng)用于Microsoft Teams平臺(tái)。隨著演講者話題的變化,實(shí)時(shí)生成的圖像也會(huì)隨之更新,從而為用戶帶來(lái)更加豐富的視覺(jué)溝通體驗(yàn)。微軟表示,這種圖像的使用有助于澄清概念,尤其適合那些需要通過(guò)視覺(jué)輔助來(lái)學(xué)習(xí)的用戶。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新
 
智快科技微信賬號(hào)
微信群

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群