ภาพเคลื่อนไหว Mona Lisa นี้สร้างโดย AI และมันน่ากลัวมาก

Pin
Send
Share
Send

รอยยิ้มที่ลึกลับและทาสีของ "โมนาลิซ่า" เป็นที่รู้จักกันทั่วโลก แต่ใบหน้าที่โด่งดังเมื่อเร็ว ๆ นี้ได้แสดงออกถึงการแสดงออกในรูปแบบใหม่ที่น่าตกใจความอนุเคราะห์ของปัญญาประดิษฐ์ (AI)

ในวิดีโอที่แชร์กับ YouTube ในวันที่ 21 พฤษภาคมคลิปวิดีโอสามรายการแสดงตัวอย่างที่ไม่น่าเชื่อของ Mona Lisa ในขณะที่เธอขยับริมฝีปากแล้วหันหัว เธอถูกสร้างขึ้นโดยเครือข่ายประสาทเทียม - ประเภทของ AI ที่ประมวลผลข้อมูลเท่าที่สมองของมนุษย์ทำเพื่อวิเคราะห์และประมวลผลภาพ

นักวิจัยได้ทำการฝึกอบรมอัลกอริทึมในการทำความเข้าใจรูปร่างทั่วไปของใบหน้าและลักษณะการทำงานที่สัมพันธ์กันและนำข้อมูลนั้นไปใช้กับภาพนิ่ง ผลที่ได้คือลำดับวิดีโอที่สมจริงของการแสดงออกทางสีหน้าใหม่จากกรอบเดียว

สำหรับวิดีโอ Mona Lisa นั้น AI "เรียนรู้" การเคลื่อนไหวใบหน้าจากชุดข้อมูลของมนุษย์สามคนทำให้เกิดภาพเคลื่อนไหวที่แตกต่างกันสามแบบ ในขณะที่แต่ละคลิปทั้งสามยังจำได้ว่าเป็นโมนาลิซ่าความแตกต่างในรูปแบบการฝึกอบรมและพฤติกรรม "บุคลิกภาพ" ที่แตกต่างไปจากรูปแบบการฝึกอบรม "ชีวิตภาพ" Egor Zakharov วิศวกรสถาบันวิทยาศาสตร์และเทคโนโลยี Skolkovo และ Samsung AI Center (ทั้งสองอยู่ในมอสโก) อธิบายไว้ในวิดีโอ

Zakharov และเพื่อนร่วมงานของเขายังสร้างแอนิเมชันจากภาพถ่ายของไอคอนวัฒนธรรมสมัยศตวรรษที่ 20 เช่น Albert Einstein, Marilyn Monroe และ Salvador Dali นักวิจัยอธิบายการค้นพบของพวกเขาซึ่งไม่ได้ผ่านการตรวจสอบโดยเพื่อนในการศึกษาที่ตีพิมพ์ออนไลน์วันที่ 20 พฤษภาคมในวารสาร preprint ของ arXiv

ใบหน้าที่คุ้นเคยคุ้นเคยกับการแสดงออกที่ไม่คุ้นเคย (เครดิตรูปภาพ: E. Zakharov และคณะ)

การผลิตวิดีโอต้นฉบับเช่นสิ่งเหล่านี้เรียกว่า deepfakes นั้นไม่ใช่เรื่องง่าย หัวมนุษย์มีความซับซ้อนทางเรขาคณิตและมีพลวัตสูง แบบจำลอง 3 มิติของหัวมี "พารามิเตอร์นับสิบล้าน" ผู้เขียนการศึกษาเขียน

ยิ่งไปกว่านั้นระบบการมองเห็นของมนุษย์นั้นดีมากในการระบุ "แม้แต่ความผิดพลาดเล็กน้อย" ในหัวมนุษย์แบบจำลอง 3 มิติตามการศึกษา การเห็นบางสิ่งที่ดูเหมือนมนุษย์เกือบ - แต่ไม่มากนัก - ทำให้เกิดความรู้สึกไม่สบายใจที่เรียกว่าเอฟเฟกต์หุบเขาลึกลับ

AI ก่อนหน้านี้ได้แสดงให้เห็นว่าสามารถสร้าง deepfakes ที่น่าเชื่อถือได้ แต่มันต้องการมุมที่หลากหลายของวัตถุที่ต้องการ สำหรับการศึกษาใหม่วิศวกรแนะนำ AI ให้กับชุดข้อมูลขนาดใหญ่มากของวิดีโออ้างอิงที่แสดงใบหน้ามนุษย์ในการทำงาน นักวิทยาศาสตร์ได้สร้างจุดสังเกตใบหน้าที่สามารถนำไปใช้กับใบหน้าใด ๆ เพื่อสอนโครงข่ายประสาทที่ใบหน้ามีพฤติกรรมอย่างไร

จากนั้นพวกเขาฝึกอบรม AI เพื่อใช้นิพจน์อ้างอิงเพื่อแมปการเคลื่อนไหวของคุณสมบัติของแหล่งที่มา สิ่งนี้ทำให้ AI สามารถสร้าง deepfake ได้แม้ว่ามันจะมีเพียงแค่ภาพเดียวที่จะใช้งานได้

และภาพจากแหล่งอื่น ๆ ก็ให้ผลลัพธ์ที่มีรายละเอียดมากขึ้นในภาพเคลื่อนไหวสุดท้าย วิดีโอที่สร้างจาก 32 ภาพแทนที่จะเป็นเพียงภาพเดียวที่ได้รับ "ความสมจริงที่สมบูรณ์แบบ" ในการศึกษาโดยผู้ใช้

Pin
Send
Share
Send