国产乱人伦在线播放,99无码精品二区在线视频,最近在线更新8中文字幕免费,精品成人一区二区三区四区

您的位置:首頁(yè) > 管理 >

谷歌AI新功能 廣角照片人臉不再扭曲變形

2019-06-25 14:02:39 來(lái)源: 量子位

合照的時(shí)候,沒有誰(shuí)喜歡站在最邊上。因?yàn)槟槙?huì)被鏡頭無(wú)情地拉扯,不止變得寬廣,還會(huì)有些歪斜:97°視場(chǎng)角不過(guò),谷歌剛剛推出了一門法術(shù)

合照的時(shí)候,沒有誰(shuí)喜歡站在最邊上。

因?yàn)槟槙?huì)被鏡頭無(wú)情地拉扯,不止變得寬廣,還會(huì)有些歪斜:

△97°視場(chǎng)角

97°視場(chǎng)角

不過(guò),谷歌剛剛推出了一門法術(shù),可以讓廣角照片里的人臉,不用再扭曲變形:

左一的妹子,右一的妹子,臉型都顯得更加對(duì)稱自然了。

左一的妹子,右一的妹子,臉型都顯得更加對(duì)稱自然了。

那么,增加一波難度。

帶上墨鏡,帶上帽子,拉長(zhǎng)的臉依然可以復(fù)原:

△103°視場(chǎng)角

103°視場(chǎng)角

用手擋住半張臉,AI還是沒有被迷惑:

△103°視場(chǎng)角

103°視場(chǎng)角

不止是這樣,AI把人臉調(diào)正的同時(shí),也不會(huì)扭曲了背景。

比如下圖,中間是DxO Viewpoint的人臉修正,后面的欄桿被擠成了一條弧線;而右邊是谷歌算法,修好了人臉,欄桿依然直挺:

團(tuán)隊(duì)說(shuō),整個(gè)修復(fù)過(guò)程都是AI自動(dòng)完成,并且在移動(dòng)端也可以運(yùn)行。

團(tuán)隊(duì)說(shuō),整個(gè)修復(fù)過(guò)程都是AI自動(dòng)完成,并且在移動(dòng)端也可以運(yùn)行。

這只善良又聰穎的AI,登上了頂會(huì)SIGGRAPH 2019

也在Reddit論壇收獲了1.9k的熱度:

有人說(shuō)Pixel,的廣角前置鏡頭已經(jīng)用上了這個(gè)算法,拍完之后點(diǎn)開照片預(yù)覽,發(fā)現(xiàn)自己的臉已經(jīng)收窄了。

現(xiàn)在就來(lái)看看,人物和背景,到底是怎樣兼顧的吧。

互補(bǔ)才是完美

谷歌說(shuō),從前想要糾正鏡頭畸變,總是需要職業(yè)的修圖士。

因?yàn)?,讓機(jī)器自動(dòng)完成的話,常常是修好了一處扭曲,又制造了另一處新的扭曲。

不過(guò),團(tuán)隊(duì)也正是從這些不完美的算法之間,發(fā)現(xiàn)了新世界的大門

先看透視投影 (Perspective Projection) 。從一個(gè)投射中心出發(fā),把一個(gè)3D物體投在2D表面上。忠于透視原理,近大遠(yuǎn)小。

這種投影一定有失真,比如站在邊上的人,離投射中心比較遠(yuǎn),臉就大了起來(lái)。不過(guò),它拉伸的主要是人臉,背景并不容易發(fā)生扭曲。

球極平面投影(Stereographic Projection) 就不同了。把一個(gè)球面投射到平面上,并不忠實(shí)反映距離,卻十分忠實(shí)地反映角度。就像這張地圖。

這種投影也一定有失真,但對(duì)一張照片來(lái)說(shuō),主要是背景里的直線會(huì)變彎,而人臉不易被拉伸。

如此說(shuō)來(lái),兩種投影愉快地互補(bǔ)了。

觀察到這個(gè)美麗的現(xiàn)實(shí),研究人員當(dāng)然要把它們的優(yōu)點(diǎn),用優(yōu)雅的方式結(jié)合起來(lái)。

觀察到這個(gè)美麗的現(xiàn)實(shí),研究人員當(dāng)然要把它們的優(yōu)點(diǎn),用優(yōu)雅的方式結(jié)合起來(lái)。

一句話概括,就是讓透視投影去處理背景,球極平面投影去處理局部 (人臉) 。

當(dāng)然,要讓兩種原本沖突的投影方式和平共處,并不是一句話的事。具體說(shuō)來(lái):

△97°視場(chǎng)角

97°視場(chǎng)角

輸入的照片如上,已經(jīng)先用透視投影處理過(guò)。

第一步,找出目標(biāo)區(qū)域:人臉,包括頭發(fā)。

這里,要用人物分割算法,給輸入圖像里的人類做個(gè)Mask;再用人臉檢測(cè)器,標(biāo)出臉部的邊界框。最后,把Mask和邊界框的交集,用綠色標(biāo)注出來(lái)。

第二步,為輸入的 (透視投影) 照片,算出一個(gè)球極平面投影。

第二步,為輸入的 (透視投影) 照片,算出一個(gè)球極平面投影。

如果把這個(gè)投影可視化,會(huì)發(fā)現(xiàn)邊角的人臉已經(jīng)修好,只是背景里,左邊的窗棱和右邊的墻彎了(下圖) 。

所以就有了關(guān)鍵的下一步:

所以就有了關(guān)鍵的下一步:

第三步,用上前兩步的數(shù)據(jù),算出一個(gè)網(wǎng)格 (Mesh) 。這個(gè)網(wǎng)格依然是做球極平面投影,但只要調(diào)整人臉區(qū)域,背景盡量保持原樣。

為了不影響背景,這里用到了能量最小化(Energy Minimization) 方法,來(lái)平息兩種投影之間的沖突,促成更加平滑的過(guò)渡。

這樣,就有了一個(gè)兼顧人臉和背景的、優(yōu)化過(guò)的網(wǎng)格:

第四步,用這個(gè)網(wǎng)格來(lái)捏那張輸入的照片,得到的就是最終答案:

第四步,用這個(gè)網(wǎng)格來(lái)捏那張輸入的照片,得到的就是最終答案:

右下角的人臉自然了,背景里的直線也還是直線。

右下角的人臉自然了,背景里的直線也還是直線。

團(tuán)隊(duì)說(shuō),這個(gè)方法可以勝任70°-120°的視場(chǎng)角。

并且,幾乎不受場(chǎng)景的限制

單人自拍可以,多人合照可以。

△103°視場(chǎng)角

△97°視場(chǎng)角

室內(nèi)戶外都表現(xiàn)穩(wěn)定;光線明暗也不影響AI的發(fā)揮。

△114°視場(chǎng)角

△104°視場(chǎng)角

除了開頭提到的帽子墨鏡、手遮臉,這些沒有難倒AI的因素之外,臉朝側(cè)面也不會(huì)給算法造成困惑。

△103°視場(chǎng)角

還要注意的是,團(tuán)隊(duì)是為了移動(dòng)端的應(yīng)用,才開發(fā)了這只AI。它的運(yùn)行速度,足以支持手機(jī)上相機(jī)App的正常交互:即時(shí)修圖,即時(shí)分享。

如果說(shuō)有什么缺憾,大概就是在捏臉的同時(shí),還不能把身體一起捏好。

而人在角落,身體也可能被拉伸,如果只把臉修到正常的形狀和大小,身體有時(shí)候就顯得太大:

即便這樣,AI也已經(jīng)滿足了廣角人像拍攝的大部分需求。

即便這樣,AI也已經(jīng)滿足了廣角人像拍攝的大部分需求。

大家一起自拍的時(shí)候,就算拿著手機(jī)的那個(gè)人是你,也不用再擔(dān)心自己的臉被拉寬拉長(zhǎng)了。

三個(gè)少年

AI的爸爸,三位谷歌少年,全部來(lái)自寶島。

一作名叫施易昌(YiChang Shih) ,本科念臺(tái)大,碩博都在麻省理工,實(shí)習(xí)經(jīng)歷遍布Adobe、谷歌研究院、微軟研究院等等。

2015年,從閃耀的CSAIL實(shí)驗(yàn)室拿到博士學(xué)位,如今已是谷歌的高級(jí)軟件工程師 (Senior Software Engineer) ,主攻移動(dòng)設(shè)備上的計(jì)算攝影。

二作是賴威昇(Wei-Sheng Lai) ,本科碩士都在臺(tái)大,現(xiàn)在是加州大學(xué)默塞德分校博四的學(xué)生。曾經(jīng)在Adobe和英偉達(dá)實(shí)習(xí),不久前剛剛結(jié)束在谷歌作為學(xué)生研究員的歷程。

三作叫梁家愷(Chia-Kai Liang) ,本科和博士都在臺(tái)大。2008年博士畢業(yè),現(xiàn)在是谷歌的高級(jí)專家軟件工程師 (Senior Staff Software Engineer) 。

One More Thing

雖然,三位作者里有兩位都曾經(jīng)在Adobe實(shí)習(xí)。

但這支團(tuán)隊(duì)孕育的AI,畫風(fēng)溫柔善解人意。

比起一周前Adobe發(fā)布的“反向PS”利器,那只能把P過(guò)的美照打回原形的AI (如下) ,這廣角人像的修復(fù)師AI,大概算得上愛的奉獻(xiàn)了。(文/栗子)

關(guān)鍵詞: 谷歌 AI 廣角照片 扭曲變形

精選 導(dǎo)讀

募資55億港元萬(wàn)物云啟動(dòng)招股 預(yù)計(jì)9月29日登陸港交所主板

萬(wàn)科9月19日早間公告,萬(wàn)物云當(dāng)日啟動(dòng)招股,預(yù)計(jì)發(fā)行價(jià)介乎每股47 1港元至52 7港元,預(yù)計(jì)9月29日登陸港交所主板。按發(fā)行1 167億股計(jì)算,萬(wàn)

發(fā)布時(shí)間: 2022-09-20 10:39
管理   2022-09-20

公募基金二季度持股情況曝光 隱形重倉(cāng)股多為高端制造業(yè)

隨著半年報(bào)披露收官,公募基金二季度持股情況曝光。截至今年二季度末,公募基金全市場(chǎng)基金總數(shù)為9794只,資產(chǎn)凈值為269454 75億元,同比上

發(fā)布時(shí)間: 2022-09-02 10:45
資訊   2022-09-02

又有上市公司宣布變賣房產(chǎn) 上市公司粉飾財(cái)報(bào)動(dòng)作不斷

再有上市公司宣布變賣房產(chǎn)。四川長(zhǎng)虹25日稱,擬以1 66億元的轉(zhuǎn)讓底價(jià)掛牌出售31套房產(chǎn)。今年以來(lái),A股公司出售房產(chǎn)不斷。根據(jù)記者不完全統(tǒng)

發(fā)布時(shí)間: 2022-08-26 09:44
資訊   2022-08-26

16天12連板大港股份回復(fù)深交所關(guān)注函 股份繼續(xù)沖高

回復(fù)交易所關(guān)注函后,大港股份繼續(xù)沖高。8月11日大港股份高開,隨后震蕩走高,接近收盤時(shí)觸及漲停,報(bào)20 2元 股。值得一提的是,在7月21日

發(fā)布時(shí)間: 2022-08-12 09:56
資訊   2022-08-12

萬(wàn)家基金再添第二大股東 中泰證券擬受讓11%基金股權(quán)

7月13日,中泰證券發(fā)布公告,擬受讓齊河眾鑫投資有限公司(以下簡(jiǎn)稱齊河眾鑫)所持有的萬(wàn)家基金11%的股權(quán),交易雙方共同確定本次交易的標(biāo)的資

發(fā)布時(shí)間: 2022-07-14 09:39
管理   2022-07-14

央行連續(xù)7日每天30億元逆回購(gòu) 對(duì)債市影響如何?

央行12日再次開展了30億元逆回購(gòu)操作,中標(biāo)利率2 10%。這已是央行連續(xù)7日每天僅進(jìn)行30億元的逆回購(gòu)縮量投放,創(chuàng)下去年1月以來(lái)的最低操作規(guī)

發(fā)布時(shí)間: 2022-07-13 09:38
資訊   2022-07-13

美元指數(shù)創(chuàng)近20年新高 黃金期貨創(chuàng)出逾9個(gè)月新低

由于對(duì)美聯(lián)儲(chǔ)激進(jìn)加息的擔(dān)憂,美元指數(shù)11日大漲近1%創(chuàng)出近20年新高。受此影響,歐美股市、大宗商品均走弱,而黃金期貨創(chuàng)出逾9個(gè)月新低。美

發(fā)布時(shí)間: 2022-07-13 09:36
資訊   2022-07-13

美股三大股指全線下跌 納斯達(dá)克跌幅創(chuàng)下記錄以來(lái)最大跌幅

今年上半年,美股持續(xù)回落。數(shù)據(jù)顯示,道瓊斯指數(shù)上半年下跌15 3%,納斯達(dá)克綜合指數(shù)下跌29 5%,標(biāo)普500指數(shù)下跌20 6%。其中,納斯達(dá)克連續(xù)

發(fā)布時(shí)間: 2022-07-04 09:51
推薦   2022-07-04

融資客熱情回升 兩市融資余額月內(nèi)增加超344億元

近期A股走強(qiáng),滬指6月以來(lái)上漲4%,融資客熱情明顯回升。數(shù)據(jù)顯示,截至6月16日,兩市融資余額1 479萬(wàn)億元,月內(nèi)增加344 67億元,最近一個(gè)半

發(fā)布時(shí)間: 2022-06-20 09:41
資訊   2022-06-20

4個(gè)交易日凈買入超百億元 北向資金持續(xù)流入A股市場(chǎng)

北向資金凈流入態(tài)勢(shì)延續(xù)。繼6月15日凈買入133 59億元后,北向資金6月16日凈買入44 52億元。自5月27日至今,除6月13日以外,北向資金累計(jì)凈

發(fā)布時(shí)間: 2022-06-17 09:37
推薦   2022-06-17

熱門TAG

more
美聯(lián)儲(chǔ)今年已將基準(zhǔn)利率從接近零大幅上調(diào)至略高于3% EIA報(bào)告:美國(guó)原油庫(kù)存及戰(zhàn)略儲(chǔ)備減少,汽油及精煉油庫(kù)存輕微波動(dòng) 美國(guó)政府更廣泛推動(dòng)從汽油動(dòng)力汽車轉(zhuǎn)向電動(dòng)汽車的一部分 數(shù)據(jù)顯示:今年9月日本船企接單量延續(xù)8月下跌下跌趨勢(shì) 公告顯示:2022年前三季度TCL中環(huán)研發(fā)投入為27億元 占比營(yíng)業(yè)收入5.42% 新的111.75億英鎊注資列在“對(duì)金融機(jī)構(gòu)的援助—支付給英格蘭銀行”標(biāo)題下 本次政府儲(chǔ)備肉投放面向北京18家主要連鎖超市門店及相關(guān)零售終端投放 有交易員預(yù)計(jì):如果LME不采取措施 接下來(lái)可能將有數(shù)十萬(wàn)噸鋁流入LME 據(jù)報(bào)道:繼德國(guó)最大釀酒商拉德貝格啤酒公司9月宣布漲價(jià) 據(jù)報(bào)道:澳大利亞礦商Pilbara的鋰礦拍賣價(jià)再創(chuàng)新高 折算后的碳酸鋰成本 中集天達(dá)首次公開發(fā)行A股股票 招股書顯示此次擬公開發(fā)行股數(shù)不超過(guò)103, 多家銀行加強(qiáng)綠色金融頂層設(shè)計(jì) 致力于為經(jīng)濟(jì)社會(huì)綠色低碳轉(zhuǎn)型貢獻(xiàn)力量 萊特幣 比特幣 數(shù)字資產(chǎn) 火幣 以太經(jīng)典 比特股 EOS 比特幣現(xiàn)金 量子鏈 Hcash 泰達(dá)幣 瑞波幣 Qcash 比特幣鉆石 超級(jí)比特幣 優(yōu)幣 硬分叉 加密貨幣