Avesiar – Jakarta
Seorang penulis bernama Kevin Zhu mengklaim telah menulis 113 makalah akademis tentang kecerdasan buatan tahun ini. Sebanyak 89 di antaranya akan dipresentasikan minggu ini di salah satu konferensi terkemuka dunia tentang AI dan pembelajaran mesin, yang telah menimbulkan pertanyaan di kalangan ilmuwan komputer tentang perkembangan penelitian AI.
Dilansir The Guardian, Sabtu (06/12/2025), ia baru saja menyelesaikan gelar sarjana ilmu komputer di University of California, Berkeley, dan sekarang menjalankan Algoverse, sebuah perusahaan riset dan mentoring AI untuk siswa sekolah menengah atas – banyak di antaranya adalah rekan penulisnya dalam makalah-makalah tersebut. Zhu sendiri lulus SMA pada tahun 2018.
Dalam dua tahun terakhir, makalah yang telah ia terbitkan mencakup topik-topik seperti penggunaan AI untuk menemukan penggembala nomaden di Afrika sub-Sahara, untuk mengevaluasi lesi kulit, dan untuk menerjemahkan dialek-dialek Indonesia. Di LinkedIn-nya, ia menggembar-gemborkan penerbitan “100+ makalah konferensi terbaik tahun lalu”, yang telah “dikutip oleh OpenAI, Microsoft, Google, Stanford, MIT, Oxford, dan banyak lagi”.
Seorang profesor ilmu komputer di Berkeley, Hany Farid, dalam sebuah wawancara mengatakan bahwa makalah-makalah Zhu adalah sebuah “bencana”. “Saya cukup yakin bahwa semuanya, dari atas ke bawah, hanyalah pengodean getaran,” katanya, merujuk pada praktik penggunaan AI untuk menciptakan perangkat lunak.
Ia menyoroti publikasi Zhu yang produktif dalam sebuah unggahan LinkedIn baru-baru ini, yang memicu diskusi tentang kasus-kasus serupa lainnya di antara para peneliti AI, yang mengatakan bahwa disiplin ilmu mereka yang baru populer menghadapi banjir makalah penelitian berkualitas rendah, yang dipicu oleh tekanan akademis dan, dalam beberapa kasus, perangkat AI.
Zhu saat menanggapi pertanyaan dari Guardian mengatakan bahwa ia telah mengawasi 131 makalah, yang merupakan “usaha tim” yang dijalankan oleh perusahaannya, Algoverse. Perusahaan tersebut mengenakan biaya 3.325 dolar kepada siswa SMA dan mahasiswa S1 untuk pengalaman mentoring daring selektif selama 12 minggu, yang mencakup bantuan untuk mengirimkan karya ke konferensi.
“Minimal, saya membantu meninjau metodologi dan desain eksperimen dalam proposal, dan saya membaca serta mengomentari draf makalah lengkap sebelum diserahkan,” ujarnya, kemudian menambahkan bahwa proyek-proyek pada subjek seperti linguistik, kesehatan, atau pendidikan melibatkan “peneliti utama atau mentor dengan keahlian yang relevan”.
Tim-tim tersebut menggunakan “alat produktivitas standar seperti pengelola referensi, pemeriksa ejaan, dan terkadang model bahasa untuk penyuntingan naskah atau meningkatkan kejelasan”, ujarnya menanggapi pertanyaan tentang apakah makalah tersebut ditulis dengan AI.
Para pengamat bot berada dalam kekacauan
Standar peninjauan untuk penelitian AI berbeda dari kebanyakan bidang ilmiah lainnya. Sebagian besar karya di bidang AI dan pembelajaran mesin tidak menjalani proses peninjauan sejawat yang ketat seperti di bidang-bidang seperti kimia dan biologi. Sebaliknya, makalah seringkali dipresentasikan secara kurang formal di konferensi-konferensi besar seperti NeurIPS, salah satu pertemuan pembelajaran mesin dan AI terkemuka di dunia, tempat Zhu dijadwalkan untuk mempresentasikan.
Farid mengatakan bahwa kasus Zhu menunjukkan masalah yang lebih besar dalam penelitian AI. Konferensi-konferensi termasuk NeurIPS kewalahan dengan meningkatnya jumlah makalah yang dikirimkan.
NeurIPS menerima 21.575 makalah tahun ini, naik dari kurang dari 10.000 pada tahun 2020. Konferensi AI terkemuka lainnya, Konferensi Internasional tentang Representasi Pembelajaran (ICLR), melaporkan peningkatan 70% dalam jumlah makalah yang dikirimkan setiap tahunnya untuk konferensi tahun 2026, hampir 20.000 makalah, naik dari lebih dari 11.000 untuk konferensi tahun 2025.
“Para pengulas mengeluhkan buruknya kualitas makalah, bahkan mencurigai beberapa di antaranya dihasilkan oleh AI. Mengapa pesta akademis ini kehilangan daya tariknya?” tanya blog teknologi Tiongkok 36Kr dalam sebuah postingan di bulan November tentang ICLR, yang mencatat bahwa skor rata-rata yang diberikan pengulas untuk makalah telah menurun dari tahun ke tahun.
Sementara itu, mahasiswa dan akademisi menghadapi tekanan yang semakin besar untuk terus mengumpulkan publikasi dan bersaing dengan rekan-rekan mereka. Menghasilkan jumlah dua digit – apalagi tiga digit – makalah ilmu komputer akademis berkualitas tinggi dalam setahun bukanlah hal yang umum, kata para akademisi.
Farid mengatakan bahwa terkadang, mahasiswanya memiliki makalah yang “diberi kode getaran” untuk meningkatkan jumlah publikasi mereka. “Begitu banyak anak muda yang ingin menekuni AI. Ada kegilaan saat ini,” kata Farid.
Jeffrey Walling, seorang profesor madya di Virginia Tech, mengatakan bahwa NeurIPS meninjau makalah yang dikirimkan kepadanya, tetapi prosesnya jauh lebih cepat dan kurang menyeluruh dibandingkan tinjauan sejawat ilmiah standar. Tahun ini, konferensi tersebut telah menggunakan sejumlah besar mahasiswa PhD untuk memeriksa makalah, yang menurut ketua area NeurIPS telah menghambat proses tersebut.
“Kenyataannya, sering kali para penilai konferensi harus meninjau lusinan makalah dalam waktu singkat, dan biasanya hanya ada sedikit atau bahkan tidak ada revisi sama sekali,” kata Walling.
Walling sependapat dengan Farid bahwa terlalu banyak makalah yang diterbitkan saat ini, dan ia mengatakan bahwa ia telah bertemu dengan penulis lain yang telah menerbitkan lebih dari 100 publikasi dalam setahun. “Akademisi lebih dihargai berdasarkan volume publikasi daripada kualitas … Semua orang menyukai mitos produktivitas super,” ujarnya.
Di halaman FAQ Algoverse milik Zhu, Answers membahas bagaimana program perusahaan tersebut dapat membantu prospek kuliah atau karier para pelamar di masa depan, dengan mengatakan: “Keahlian, prestasi, dan publikasi yang Anda capai di sini sangat dihargai di kalangan akademis dan memang dapat memperkuat aplikasi kuliah atau resume Anda. Hal ini terutama berlaku jika penelitian Anda diterima di konferensi terkemuka – sebuah prestasi bergengsi bahkan bagi peneliti profesional.”
Farid mengatakan bahwa ia kini menyarankan para mahasiswa untuk tidak terjun ke dalam penelitian AI, karena “kegilaan” di bidang tersebut dan banyaknya karya berkualitas rendah yang dihasilkan oleh orang-orang yang berharap dapat meningkatkan prospek karier mereka.
“Ini benar-benar kacau. Anda tidak bisa mengimbangi, Anda tidak bisa mempublikasikan, Anda tidak bisa menghasilkan karya yang baik, Anda tidak bisa berpikir jernih,” ujarnya.
Banjir Sampah
Masih banyak karya luar biasa yang dihasilkan dari proses ini. Salah satu yang terkenal adalah makalah Google tentang transformer, Attention Is All You Need – landasan teori untuk kemajuan AI yang mengarah pada ChatGPT – yang dipresentasikan di NeurIPS pada tahun 2017.
Penyelenggara NeurIPS sepakat bahwa konferensi ini berada di bawah tekanan. Dalam komentarnya kepada Guardian, seorang juru bicara mengatakan bahwa pertumbuhan AI sebagai sebuah bidang telah membawa “peningkatan signifikan dalam pengajuan makalah dan peningkatan nilai yang diberikan pada penerimaan peer-review di NeurIPS”, yang memberikan “beban yang cukup besar pada sistem peninjauan kami”.
Pengajuan Zhu sebagian besar ditujukan untuk lokakarya di NeurIPS, yang memiliki proses seleksi berbeda dari konferensi utama dan seringkali merupakan tempat karya-karya awal karier dipresentasikan, kata penyelenggara NeurIPS. Farid mengatakan ia tidak menganggap hal ini sebagai penjelasan substantif bagi seseorang untuk mencantumkan namanya di lebih dari 100 makalah.
“Saya tidak menganggap ini sebagai argumen yang meyakinkan untuk mencantumkan nama Anda di 100 makalah yang tidak mungkin Anda kontribusikan secara berarti,” kata Farid.
Masalahnya lebih besar daripada banjir makalah di NeurIPS. ICLR menggunakan AI untuk meninjau kiriman dalam jumlah besar – yang menghasilkan kutipan dan umpan balik yang terkesan halusinasi dan “sangat bertele-tele dengan banyak poin-poin penting”, menurut sebuah artikel terbaru di Nature.
Perasaan kemunduran begitu meluas sehingga menemukan solusi untuk krisis ini telah menjadi subjek makalah itu sendiri. Sebuah makalah posisi yang terbit pada Mei 2025 – sebuah versi akademis berbasis bukti dari sebuah opini di surat kabar – yang ditulis oleh tiga ilmuwan komputer Korea Selatan yang mengusulkan solusi untuk “tantangan yang belum pernah terjadi sebelumnya dengan lonjakan kiriman makalah, disertai dengan meningkatnya kekhawatiran atas kualitas tinjauan dan tanggung jawab peninjau”, memenangkan penghargaan untuk karya luar biasa di Konferensi Internasional tentang Pembelajaran Mesin 2025.
Sementara itu, kata Farid, perusahaan teknologi besar dan organisasi keamanan AI kecil kini mengunggah karya mereka ke arXiv, situs yang dulunya hanya menyediakan cetakan awal makalah matematika dan fisika yang jarang dibaca, membanjiri internet dengan karya yang disajikan sebagai sains – tetapi tidak tunduk pada standar peninjauan.
Harganya, kata Farid, adalah hampir mustahil untuk mengetahui apa yang sebenarnya terjadi di bidang AI – bagi jurnalis, publik, dan bahkan para ahli di bidang tersebut: “Anda tidak punya kesempatan, tidak ada kesempatan sebagai pembaca biasa untuk mencoba memahami apa yang terjadi dalam literatur ilmiah. Rasio sinyal-ke-derau Anda pada dasarnya satu. Saya hampir tidak bisa menghadiri konferensi-konferensi ini dan mencari tahu apa yang sebenarnya terjadi.”
“Yang saya sampaikan kepada mahasiswa adalah, jika Anda ingin mengoptimalkan makalah yang diterbitkan, sejujurnya tidak terlalu sulit. Kerjakan saja pekerjaan yang sangat buruk dan berkualitas rendah, lalu ramaikan konferensi dengan pekerjaan itu. Namun, jika Anda ingin mengerjakan pekerjaan yang benar-benar bijaksana dan cermat, Anda berada pada posisi yang kurang menguntungkan karena secara efektif Anda akan kehilangan kendali secara sepihak,” ujarnya. (ard)











Discussion about this post