Plot Twist DeepSeek Ternyata Buka Pure Buatan China?

tautekno.id – Kemunculan model kecerdasan buatan (AI) DeepSeek R1 dari Tiongkok telah menciptakan kehebohan di kancah global. Bahkan model AI ini mengancam dominasi teknologi Amerika Serikat.

DeepSeek secara mengklaim mampu menciptakan AI berkinerja tinggi yang setara dengan produk buatan AS, namun dengan biaya yang jauh lebih hemat. Sontak, kabar ini membuat harga saham perusahaan teknologi besar AS ramai-ramai merosot tajam saat peluncuran DeepSeek R1.

Fenomena ini semakin menarik mengingat DeepSeek muncul di tengah agresivitas AS yang memblokir akses Tiongkok terhadap chip dan alat pembuat chip canggih. Kehadiran DeepSeek seolah menjadi bukti bahwa Tiongkok mampu mengembangkan AI secara mandiri, tanpa harus bergantung pada teknologi AS.

Kecurigaan Penggunaan Gemini

Pekan lalu, DeepSeek kembali menjadi sorotan setelah merilis versi pembaruan R1. Meski perusahaan tidak mengungkapkan sumber data yang digunakan untuk melatih model tersebut, para peneliti AI ramai berspekulasi bahwa sebagian datanya berasal dari keluarga AI Gemini milik Google.

Sam Paech, menyebutkan bahwa model terbaru DeepSeek, yang dinamai R1-0528, menggunakan “kata-kata dan ekspresi yang mirip dengan Gemini 2.5 Pro milik Google,”

Meski laporan Paech bukan merupakan bukti yang mutlak, pengembang lain seperti SpeechMap, juga mencatat bahwa model DeepSeek “terbaca seperti jejak Gemini.” Sebagai informasi, jejak model merujuk pada pikiran yang dikumpulkan suatu model AI untuk menghasilkan kesimpulan.

Dugaan Memakai Data ChatGPT untuk Pelatihan Model AI

Kecurigaan terhadap DeepSeek yang diduga menggunakan data dari sistem AI pesaing untuk melatih modelnya bukanlah hal baru. Pada Desember tahun lalu, beberapa pengembang yang mengobservasi model V3 DeepSeek. Dari sini para pengembang menemukan bahwa sistem tersebut kerap mengidentifikasi dirinya sebagai ChatGPT buatan OpenAI dari AS. Hal ini mengindikasikan kuat bahwa model V3 DeepSeek kemungkinan dilatih menggunakan chat log dari ChatGPT.

Bahkan, awal tahun ini, OpenAI sempat memberi tahu Financial Times bahwa mereka menemukan bukti yang mengaitkan DeepSeek dengan praktik distilasi. Distilasi adalah teknik untuk melatih model AI dengan mengekstraksi data dari model yang lebih besar dan lebih canggih.

Meskipun distilasi bukan praktik yang tidak umum, perlu dicatat bahwa ketentuan layanan OpenAI secara tegas melarang pelanggannya menggunakan keluaran model perusahaan untuk membangun AI saingan.

Para ahli AI, seperti Nathan Lambert, tidak menganggap mustahil bahwa DeepSeek melatih modelnya menggunakan data dari Gemini milik Google.

Apakah DeepSeek benar-benar melanggar etika pengembangan AI ataukah ini murni hasil dari inovasi cerdas yang lebih efisien? Pertanyaan ini masih menjadi perdebatan di kalangan komunitas AI global.

(amd)