Nvidia Ciptakan Teknologi untuk Video Call Hemat Bandwidth

RN Dahlan

Nvidia mengumumkan platform konferensi video terbaru mereka yang bernama Nvidia Maxine. Platform baru ini diklaim dapat memperbaiki beberapa masalah paling umum dalam panggilan video.

Yang menarik, Nvidia menyebutkan, platform konferensi Maxine ini akan memproses panggilan di cloud menggunakan GPU Nvidia. 



Tak hanya itu, ia juga dapat meningkatkan kualitas panggilan dengan berbagai cara dan bantuan dari kecerdasan buatan atau AI. Bagaimana caranya?

Menurut Nvidia, dengan digunakannya AI, Maxine dapat menyetel kembali wajah dan tatapan penelepon sehingga mereka selalu melihat langsung ke kamera. 

Metode ini dapat mengurangi kebutuhan bandwidth untuk video hingga sepersepuluh dari persyaratan standar kompresi video streaming H.264. Ia cukup hanya mentransmisikan "titik wajah utama", dan meningkatkan resolusi videonya.



Fitur lain yang tersedia di Maxine ini adalah pencahayaan ulang wajah, terjemahan dan transkripsi waktu nyata, dan avatar animasi. Namun tentunya, tidak semua fitur tersebut merupakan teknologi baru.

Kompresi video dan transkripsi waktu nyata cukup umum. Microsoft dan Apple telah memperkenalkan penyelarasan pandangan di Surface Pro X dan FaceTime untuk memastikan orang-orang menjaga kontak mata selama panggilan video. Meskipun begitu, fitur penyelarasan wajah dari Nvidia ini terlihat seperti versi yang jauh lebih ekstrem dan bagus.

Tetapi Nvidia tidak diragukan lagi berharap pengaruhnya dalam komputasi Cloud dan R&D AI yang mengesankan akan membantunya melampaui para pesaingnya. 

Yang jadi pertanyaan, apakah akan ada perusahaan videoconferencing mapan benar-benar mengadopsi teknologi Nvidia? 

Maxine bukanlah platform konsumen tetapi perangkat bagi perusahaan pihak ketiga untuk meningkatkan perangkat lunak para pemilik perusahaan video conferencing.

Sejauh ini Nvidia belum mengumumkan partner mana pun yang akan menggunakan Maxine di masa mendatang. Meskipun begitu, Nvidia mengklaim bahwa saat ini mereka sedang "dalam diskusi" dengan beberapa perusahaan perangkat video conference. 



Baca juga:


Dalam sebuah wawancara, Richard Kerris, General Manager Nvidia untuk media dan hiburan menggambarkan Maxine sebagai produk yang sangat menarik dan sangat tepat waktu. Kerris  menyoroti kompresi video yang didukung AI sebagai fitur yang sangat berguna. 

"Kita semua pernah mengalami saat-saat ketika bandwidth menjadi batasan dalam konferensi," kata Kerris. "Jika kita menerapkan AI pada masalah ini, kita dapat merekonstruksi adegan yang berbeda di kedua ujungnya dan hanya mengirimkan apa yang perlu dikirim, dengan demikian mengurangi bandwidth secara signifikan," ucapnya.

Nvidia mengatakan, fitur kompresinya menggunakan metode AI yang dikenal sebagai jaringan adversarial generatif atau GAN untuk merekonstruksi sebagian wajah pemanggil di cloud. Ini adalah teknik yang sama yang digunakan di teknologi Deepfake. 



Alih-alih mengalirkan seluruh layar piksel, perangkat lunak AI menganalisis titik-titik wajah utama setiap orang dalam panggilan dan kemudian dengan cerdas menghidupkan kembali wajah dalam video di sisi lain. 

Pengumuman dari Nvidia ini menjadi gambaran bagaimana video conference akan lebih artifisial daripada sebelumnya, dengan AI yang menghemat bandwitdh.