Qwen3-Thinking Rilis, AI Alibaba Saingi Google & OpenAI

Alibaba kembali menggebrak dunia kecerdasan buatan (AI) dengan merilis model penalaran AI open-source terbaru: Qwen3-235B-A22B-Thinking-2507. Model ini tidak hanya menunjukkan performa luar biasa di berbagai benchmark, tetapi juga mengungguli model unggulan dari Google dan OpenAI, termasuk Gemini 2.5 Pro dan o4-mini.

Baca Juga: ChatGPT Agent, Asisten Digital Baru yang Bisa Bikin PPT dan Kirim E-mail Sendiri

Read More


Qwen3-Thinking-2507 dirancang sebagai model AI tingkat lanjut dengan fokus utama pada kemampuan penalaran matematis dan logis. Pada benchmark AIME25, model ini mencetak skor 92,3, melampaui Gemini 2.5 Pro (88,0) dan berbagai model sejenis lainnya.
Tak hanya itu, Qwen3-Thinking juga menunjukkan kemampuan coding yang mumpuni. Di uji coba LiveCodeBench v6, skornya mencapai 74,1, lebih tinggi dari Gemini-2.5 Pro (72,5) dan o4-mini dari OpenAI (71,8).

Respons Lebih Manusiawi, Jawaban Lebih Relevan


Dalam benchmark Arena-Hard v2, yang mengukur seberapa relevan jawaban AI dari perspektif manusia, Qwen3-Thinking-2507 meraih skor 79,7, menjadi yang tertinggi dibandingkan model lainnya seperti DeepSeek-R1-0528 (72,2).
Artinya, model ini lebih mampu memahami konteks percakapan dan memberikan respons yang lebih natural dan sesuai preferensi pengguna manusia.
Dibangun dengan arsitektur Mixture-of-Experts (MoE), Qwen3-Thinking memiliki total 235 miliar parameter namun hanya mengaktifkan subset 22 miliar parameter per tugas. Ini menjadikannya efisien, cepat, dan hemat sumber daya komputasi—ideal untuk berbagai skenario penggunaan AI skala besar.
Alibaba juga memperluas jendela konteks menjadi 262.144 token, memungkinkan pemrosesan informasi yang lebih panjang dan kompleks dalam satu interaksi.

Baca Juga: Peran Teknologi AI Alibaba Cloud Sukseskan Olimpiade Paris 2024

Pendekatan Baru Tanpa “Hybrid Thinking”


Berbeda dengan versi sebelumnya, model ini tidak lagi menggunakan pendekatan hybrid thinking yang memerlukan pengalihan manual antar mode. Kini, Alibaba melatih model Instruct dan Thinking secara terpisah untuk meningkatkan akurasi dan efisiensi masing-masing fungsi.
“Setelah berdiskusi dengan komunitas, kami tinggalkan mode hybrid dan fokus pada pelatihan khusus untuk masing-masing fungsi,” ujar tim pengembang Qwen.
Model ini telah tersedia secara open-source di platform AI Hugging Face dan dapat diakses via API. Harganya kompetitif: $0,70 per juta token input dan $8,40 per juta token output.
Dengan kemampuan unggul, pendekatan teknis baru, dan lisensi open-source, Qwen3-Thinking-2507 diprediksi jadi standar baru model AI penalaran global—dan menjadi pesaing serius OpenAI maupun Google dalam pengembangan AI generatif.

Related posts