Cara menggunakan LLM pada pelayan sendiri di Malaysia: panduan praktikal — kita kupas secara terperinci, berpandukan keperluan dan amalan semasa.
Mengapa perlu
Kawalan penuh ke atas data dan residensi; kritikal untuk data sensitif dan jangkaan BNM/MDA.
Apa yang diperlukan
Sumber GPU (rantau awan Malaysia dalam tenancy sendiri, TM One, atau pelayan sendiri) dan model sumber terbuka. Lapisan model boleh dijadikan tempatan atau sumber terbuka: MaLLaM (Mesolitica, open-weight 1.1B/3B/5B, dilatih untuk Bahasa Melayu), SEA-LION (AI Singapore, open-weight, menyokong Bahasa Melayu dan bahasa SEA lain), ILMU (YTL AI Labs, model multimodal buatan Malaysia — melalui API sahaja, bukan open-weight), serta open-weight Llama, Qwen dan Mistral. Semuanya boleh disambung melalui BYOK atau dijalankan secara setempat.
Cara memudahkan
osFoundry ialah platform orkestrasi AI hibrid: model BYOK (anda menyambung kunci model sendiri), kod sumber tersedia (source-available), penggunaan dalam infrastruktur sendiri, dan inferens setempat (melalui llama.cpp) yang membolehkan data tidak meninggalkan perimeter anda. Inferens setempat melalui llama.cpp membolehkan data tidak meninggalkan perimeter.
Kebebasan dan kejujuran
dgm ialah rakan penyepaduan bebas (tidak bergabung dengan osFoundry / OS LLC) dan bukan penasihat undang-undang. dgm belum mempunyai integrasi pelanggan yang selesai, jadi senario di bawah diterangkan sebagai tipikal atau berkemungkinan, bukan projek yang telah disiapkan.
Kesimpulan
Seni bina dengan residensi data di Malaysia dibina dgm pada platform osFoundry (BYOK, model tempatan dan sumber terbuka). Hubungi dgm untuk membincangkan senario anda dan merancang seni bina.