Langsung ke konten utama

ChatGPT Kualitasnya Menurun?

Model bahasa besar (Large Language Model) besutan OpenAI telah mendapatkan pengakuan luas dan pujian dari berbagai kalangan. Kevin Roose, penulis "Futureproof: 9 Rules for Humans in the Age of Automation," dan CEO Nvidia Jensen Huang, memuji model ini sebagai "chatbot kecerdasan buatan terbaik" yang pernah dirilis ke masyarakat umum dan sebagai prestasi besar dalam komputasi.

Model ini juga telah menghadapi ujian Turing dan berhasil mendapatkan skor tinggi dalam berbagai bidang ujian prestasi. Mulai dari ujian seperti matematika, hukum, dan GRE verbal.

Selain itu, ChatGPT juga telah memberikan respons yang sangat baik dalam konteks perawatan Kesehatan. Sebuah laporan dari sekolah kedokteran NYU muncul dan menyatakan bahwa saran yang diberikan oleh ChatGPT hampir tidak dapat dibedakan dari saran yang diberikan oleh staf medis manusia.

Meskipun demikian, peneliti dari Stanford University dan University of California, Berkeley, telah menunjukkan kekhawatiran terkait konsistensi kinerja ChatGPT.

Para peneliti tersebut menemukan variasi yang signifikan dalam kinerja model ini, termasuk penurunan dalam beberapa tugas dari Maret hingga Juni.

Contohnya adalah penurunan tingkat akurasi dalam pemecahan masalah matematika dan pembuatan kode komputer. Kritik juga muncul terkait penyebab perubahan tersebut. Tingkat akurasi model ini mengalami penurunan yang mencolok dalam beberapa kasus.

Baca juga:


Para peneliti mencatat bahwa sulit untuk menentukan penyebab perubahan dalam kinerja ChatGPT. Beberapa teori konspirasi muncul, tetapi OpenAI menolak klaim tersebut dan mengatakan bahwa setiap versi baru seharusnya lebih pintar.

Selain itu, permintaan telah muncul agar OpenAI mengungkapkan sumber materi pelatihan, kode, dan elemen struktural lainnya di balik ChatGPT 4.0 untuk memungkinkan verifikasi oleh komunitas ilmiah.

Apapun itu, perdebatan dan tantangan seputar penggunaan model bahasa besar seperti ChatGPT dalam berbagai konteks terus berlangsung. Para peneliti menyatakan pentingnya OpenAI melakukan transparansi dalam proses pembuatan LLM dan penggunaannya.

Postingan Populer

Cara Cek Chipset Smartphone Android Secara Akurat

Smartphone merupakan perangkat yang memiliki banyak komponen penting, seperti prosessor, memori internal dan eksternal, graphic processing unig (GPU) dan lainnya. Salah satu bagian terpentingnya adalah prosessor. Komponen prosessor sendiri terdiri dari chipset yang memiliki beberapa buah core dengan clock speed yang mungkin berbeda-beda, dan juga GPU. Cara cek chipset smartphone Android dapat dilakukan dengan beberapa metode. Kegiatan mengecek chipset sendiri perlu dilakukan dalam rangka mengetahui spesifikasi perangkat keras yang terdapat di dalam smartphone. Apakah sesuai dengan standar atau resmi. Selain itu, dengan melakukan pengecekan, kita dapat mencegah penipuan yang mungkin terjadi. Berikut ini cara cek chipset smartphone Android yang mungkin bisa Anda lakukan pula pada smartphone Android Anda: Cara Cek Melalui Menu Pengaturan Ini merupakan cara pertama yang bisa kamu lakukan. Langkah-langkahnya adalah: Buka menu pengaturan di smartphone Android Anda Pilih S...

Review Laptop OLED Murah Asus Vivobook Go 15 E1504

Anda yang bekerja di hadapan komputer seharian mungkin kerap mengalami kelelahan pada mata. Ini tentu hal yang wajar, mengingat demi menjaga kesehatan, mata kita perlu secara berkala istirahat sejenak, melihat pemandangan sekitar atau sekadar mengalihkan pandangan dari layar. Akan tetapi, bagi Anda yang sibuk dan punya setumpuk pekerjaan, meninggalkan layar laptop barang 10-15 menit bukanlah opsi. Apalagi kalau kita sedang di tengah meeting online yang sangat krusial. Atau malah Anda yang menjadi pemateri. Salah satu opsi untuk mengurangi mata lekas lelah saat bekerja adalah menggunakan laptop dengan layar yang lebih lebar dan yang penting, menggunakan panel OLED. Alasannya, layar lebih lebar akan membuat mata tidak harus terlalu dipicingkan untuk melihat teks di layar. Dan laptop OLED membuat mata lebih segar, karena mereduksi pancaran sinar biru yang berbahaya. Laptop OLED yang paling tepat untuk aktivitas seperti ini salah satunya adalah Asus Vivobook Go 15 OLED E1504. Selain murah,...

Intel Lepaskan Divisi Manufaktur Jika Teknologi Chip 18A Gagal

Intel mengungkapkan kemungkinan memisahkan divisi manufakturnya jika teknologi chip 18A yang direncanakan rilis tahun depan gagal memenuhi ekspektasi. Co-CEO sementara, Michelle Johnston Holthaus dan David Zinsner, menyatakan bahwa masa depan Intel sebagai perusahaan yang terintegrasi antara desain dan manufaktur kini tidak lagi pasti. Teknologi 18A menjadi taruhan besar Intel untuk mengembalikan dominasi di industri semikonduktor. Namun, perusahaan telah kehilangan nilai pasar lebih dari $100 miliar dan kalah bersaing dari Taiwan Semiconductor Manufacturing Company (TSMC) serta Nvidia, yang kini memimpin di pasar chip AI. Intel Foundry, divisi manufaktur perusahaan, telah dipersiapkan untuk beroperasi sebagai unit independen dengan dewan operasional dan sistem bisnis terpisah. Langkah ini menandai potensi pemisahan penuh dari Intel jika teknologi 18A tidak berhasil. Pemutusan hubungan dengan divisi manufaktur akan menjadi perubahan besar, mengingat model bisnis terintegrasi adalah cir...

Samsung Kurangi Ketergantungan pada Qualcomm

Samsung dilaporkan tengah mempersiapkan langkah besar dengan memperkenalkan chip Exynos 2600 pada lini Galaxy S26 mendatang. Langkah ini dilihat sebagai upaya mengurangi ketergantungan terhadap prosesor Snapdragon buatan Qualcomm, yang selama ini menjadi andalan perangkat flagship Samsung. Menurut laporan dari akun @Jukanlosreve di X (sebelumnya Twitter) dan GSMArena, Galaxy S26 akan menandai kembalinya Samsung ke jajaran prosesor Exynos setelah sebelumnya menghadapi berbagai tantangan produksi dengan Exynos 2500. Akibat masalah yield, Samsung memilih untuk tidak menggunakan Exynos 2500 pada Galaxy S25, yang akan sepenuhnya bergantung pada prosesor Qualcomm Snapdragon 8 Elite. Namun, Exynos 2500 diperkirakan tidak sepenuhnya ditinggalkan. Chip ini mungkin akan digunakan untuk perangkat kelas menengah dan lipat seperti Galaxy Z Flip7 dan Flip FE. Sementara itu, Exynos 2600 yang lebih canggih direncanakan menjadi otak di balik lini Galaxy S26, memberikan peluang bagi Samsung untuk mengur...

Australia Larang Anak di Bawah 16 Tahun Main Medsos

Australia menjadi negara pertama di dunia yang memberlakukan larangan total bagi anak-anak di bawah 16 tahun untuk menggunakan media sosial. Undang-undang ini disahkan melalui Online Safety Amendment (Social Media Minimum Age) Bill 2024, yang bertujuan melindungi kesehatan mental dan kesejahteraan anak-anak. Perdana Menteri Anthony Albanese, yang memperkenalkan RUU ini, menyatakan, “Kami ingin anak-anak Australia memiliki masa kecil yang utuh. Kami juga ingin orang tua merasa tenang.” RUU ini disahkan oleh Senat dengan suara 34 berbanding 19, setelah sebelumnya menerima dukungan mayoritas di House of Representatives. Undang-undang ini menetapkan denda hingga AU$50 juta bagi platform media sosial yang gagal mencegah akses oleh anak di bawah umur. Platform seperti TikTok, Instagram, Snapchat, X (sebelumnya Twitter), Reddit, dan Facebook akan terpengaruh oleh larangan ini. Namun, platform permainan, layanan pesan instan, serta situs tanpa akun seperti YouTube dikecualikan. Larangan ini ak...