artificial-intelligence

AI・人工知能

音声だけで話者の「顔」を復元できるAIが開発される

2021.01.27 Wednesday

2019.05.29 Wednesday

youtubeチャンネルナゾロジー

なぜ雪の結晶はすべて「六角形」なの？身近な疑問を解説

なぜ雪の結晶はすべて「六角形」なの？身近な疑問を解説

ジャンクフードに依存してしまう理由を解明！脳が神経回路を変化させる

ジャンクフードに依存してしまう理由を解明！脳が神経回路を変化させる

【人類VSウイルス】人類を苦しめてきた最悪のウイルス7選

【人類VSウイルス】人類を苦しめてきた最悪のウイルス7選

「お日様の匂い」の正体を解説！ダニの死骸は誤った知識

「お日様の匂い」の正体を解説！ダニの死骸は誤った知識

目次

Credit:depositphotos

Point

■音声情報から話者の顔を復元できる機能を持つAIが開発される

■この技術はAIに何百万人もの話者の動画をインプットさせ、声と顔の共通性を学習させることで可能となった

■声の波長域に共通する身体的特徴を抜き出して再構築する仕組みなので、厳密な個人の顔ではなく平均的な顔が生成される

アメリカ・カーネギーメロン大学の研究チームが、驚くべき能力を持つAIの開発に成功した。その名も「Speech2Face」。

このAI、なんと音声情報だけから話者の顔をほぼ正確に復元することができるという。

研究の詳細は、5月25日付けで「arXiv」上に発表されている。

Reconstructing faces from voices
https://arxiv.org/pdf/1905.10604.pdf

数百万人の「声」と「顔」のデータを学習

「Speech2Face」の機能は、短いボイスクリップを分析して、そこから話者にマッチする身体的特徴を選び出し再構築するものだ。

「声」と「顔」には強いつながりがあると考えられており、話し方や声のトーンには年齢や性別、民族性、言語のアクセントなどが大きく影響する。この考えをもとに研究チームは、インターネットやYoutube上にアップされている動画から何百万人もの話者の様子をAIに学習させた。

その際、データを「声」と「顔」に分けており、ある声のトーンや話し方に共通する話者の顔を予測できるように訓練した。

Credit:github

顔画像の生成には「GAN(Generative adversarial networks=敵対的生成ネットワーク)」が用いられている。

GANには「Generator(生成器)」と「Discriminator(識別器)」という2種類のネットワークが搭載されており、生成器は識別器に本物と誤認させられるような画像を生成する。対して識別器はそれに騙されないよう偽物を見分けようとする。

こうして互いを敵対させながらより正確な画像へと近づけていくのが「GAN」の機能だ。これはしばしば偽札を作る「犯人」とそれを見分ける「警察」との関係に例えられる。

偽札がバレた犯人はより本物に近いものを偽造し、またそれを警察が識別する。これを繰り返すと、ほとんど本物に近い偽札が出来るまで精度をあげることが可能となる。

次ページある声の波長域に共通する「平均的な顔」が生成される

<

1

2

>

人気記事ランキング

Amazonお買い得品ランキング

日用品

1位

【Amazon.co.jp限定】【大容量】デカラクサイズアタック抗菌EX 洗濯洗剤液体洗ってもぶりかえすゾンビ臭断絶へ! つめかえ用 2800ｇ

【Amazon.co.jp限定】【大容量】デカラクサイズアタック抗菌EX 洗濯洗剤液体洗ってもぶりかえすゾンビ臭断絶へ! つめかえ用 2800ｇ

2位

【大容量】ワイドハイターEXパワー液体衣料用漂白剤見過ごせなくなった汚れやニオイ、洗剤にちょい足しで超絶スッキリ！！詰替用２４０0ml ツンとしないさわやかな花の香り

【大容量】ワイドハイターEXパワー液体衣料用漂白剤見過ごせなくなった汚れやニオイ、洗剤にちょい足しで超絶スッキリ！！詰替用２４０0ml ツンとしないさわやかな花の香り

3位

【Amazon.co.jp限定】【大容量】デカラクサイズアタックZERO ドラム式専用洗濯洗剤液体アタック液体史上最高の清潔力。菌の隠れ家蓄積0へ詰め替え 2200ｇ

【Amazon.co.jp限定】【大容量】デカラクサイズアタックZERO ドラム式専用洗濯洗剤液体アタック液体史上最高の清潔力。菌の隠れ家蓄積0へ詰め替え 2200ｇ

4位

【Amazon.co.jp限定】【大容量】デカラクサイズアタックZERO 洗濯洗剤液体アタック液体史上最高の清潔力。菌の隠れ家蓄積0へつめかえ用2200ｇ清々しいリーフィブリーズの香り(微香)

【Amazon.co.jp限定】【大容量】デカラクサイズアタックZERO 洗濯洗剤液体アタック液体史上最高の清潔力。菌の隠れ家蓄積0へつめかえ用2200ｇ清々しいリーフィブリーズの香り(微香)

5位

IROKA フレアフレグランス液体柔軟剤香水のように上質で透明感あふれる香りネイキッドリリーの香り 1200ml 大容量

IROKA フレアフレグランス液体柔軟剤香水のように上質で透明感あふれる香りネイキッドリリーの香り 1200ml 大容量

スマホ用品

1位

【Amazon.co.jp限定】バッファロー microSD 128GB 100MB/s UHS-1 U1 microSDXC【 Nintendo Switch/ドライブレコーダー対応】V10 A1 IPX7 Full HD RMSD-128U11HA/N

【Amazon.co.jp限定】バッファロー microSD 128GB 100MB/s UHS-1 U1 microSDXC【 Nintendo Switch/ドライブレコーダー対応】V10 A1 IPX7 Full HD RMSD-128U11HA/N

2位

Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 100W 結束バンド付き USB PD対応シリコン素材採用 Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)

Anker PowerLine III Flow USB-C & USB-C ケーブル Anker絡まないケーブル 100W 結束バンド付き USB PD対応シリコン素材採用 Galaxy iPad Pro MacBook Pro/Air 各種対応 (1.8m ミッドナイトブラック)

3位

Apple AirTag

4位

Samsung microSDカード 256GB EVO Plus microSDXC UHS-I U3 Nintendo Switch 動作確認済最大転送速度130MB/秒 MB-MC256KA/EC 国内正規保証品

Samsung microSDカード 256GB EVO Plus microSDXC UHS-I U3 Nintendo Switch 動作確認済最大転送速度130MB/秒 MB-MC256KA/EC 国内正規保証品

5位

Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応テレワークリモート在宅勤務 0.9m ホワイト

Anker USB Type C ケーブル PowerLine USB-C & USB-A 3.0 Xperia/Galaxy/LG/iPad Pro/MacBook その他 Android 等 USB-C機器対応テレワークリモート在宅勤務 0.9m ホワイト

ゲーム

1位

スーパーマリオブラザーズワンダー -Switch

スーパーマリオブラザーズワンダー -Switch

2位

桃太郎電鉄ワールド ~地球は希望でまわってる! ~

桃太郎電鉄ワールド ~地球は希望でまわってる! ~

3位

Pikmin 4(ピクミン 4) -Switch

Pikmin 4(ピクミン 4) -Switch

4位

ニンテンドープリペイド番号 9000円|オンラインコード版

ニンテンドープリペイド番号 9000円|オンラインコード版

5位

【Switch用追加コンテンツ】ポケットモンスタースカーレット・バイオレットゼロの秘宝 |オンラインコード版

【Switch用追加コンテンツ】ポケットモンスタースカーレット・バイオレットゼロの秘宝 |オンラインコード版

小説

1位

変な家2 ～11の間取り図～

2位

変な家

3位

十角館の殺人〈新装改訂版〉｢館｣シリーズ (講談社文庫)

十角館の殺人〈新装改訂版〉｢館｣シリーズ (講談社文庫)

4位

近畿地方のある場所について

5位

変な絵

AI・人工知能のニュースartificial-intelligence news

もっと見る

役立つ科学情報

注目の科学ニュースpick up !!