កំពុងផ្ទុក...

ថ្ងៃ សុក្រ ទី២ ខែ មករា ឆ្នាំ ២០២៦

DeepSeek ចាប់ផ្តើមឆ្នាំ ២០២៦ ជាមួយនឹងសញ្ញាក្រដាសជំរុញឱ្យបណ្តុះបណ្តាលម៉ូដែលធំៗក្នុងតម្លៃទាបជាង


  • ដោយ Admin
  • Jan 02, 2026
  • នៅក្នុង AI

DeepSeek បានបោះពុម្ពផ្សាយឯកសារបច្ចេកទេសមួយដែលសហសរសេរដោយស្ថាបនិក Liang Wenfeng ដោយស្នើឱ្យមានការគិតឡើងវិញអំពីស្ថាបត្យកម្មការរៀនសូត្រជ្រៅរបស់ខ្លួន

ក្រុមហ៊ុនចាប់ផ្តើមអាជីវកម្មបញ្ញាសិប្បនិម្មិតរបស់ចិន DeepSeek បានស្វាគមន៍ឆ្នាំ 2026 ជាមួយនឹងឯកសារបច្ចេកទេសថ្មីមួយ ដែលសហសរសេរដោយស្ថាបនិក Liang Wenfeng ដែលស្នើឱ្យមានការគិតឡើងវិញអំពីស្ថាបត្យកម្មជាមូលដ្ឋានដែលប្រើដើម្បីបណ្តុះបណ្តាលគំរូ AI ជាមូលដ្ឋាន។

វិធីសាស្រ្តនេះ - ដែលមានឈ្មោះថា Manifold-Constrained Hyper-Connections (mHC) - បង្កើតបានជាផ្នែកមួយនៃការជំរុញរបស់ក្រុមហ៊ុន Hangzhou ដើម្បីធ្វើឱ្យគំរូរបស់ខ្លួនមានប្រសិទ្ធភាពចំណាយកាន់តែច្រើន ខណៈពេលដែលវាខិតខំដើម្បីតាមទាន់គូប្រជែងអាមេរិកដែលមានមូលនិធិល្អជាងជាមួយនឹងការចូលប្រើប្រាស់ថាមពលកុំព្យូទ័រកាន់តែស៊ីជម្រៅ។

វាក៏បានឆ្លុះបញ្ចាំងពីវប្បធម៌បើកចំហរ និងសហការគ្នាកាន់តែខ្លាំងឡើងក្នុងចំណោមក្រុមហ៊ុន AI របស់ចិន ដែលបានបោះពុម្ពផ្សាយចំណែកកាន់តែច្រើននៃការស្រាវជ្រាវរបស់ពួកគេជាសាធារណៈ។

តើអ្នកមានសំណួរអំពីប្រធានបទ និងនិន្នាការធំបំផុតពីជុំវិញពិភពលោកទេ? ទទួលបានចម្លើយជាមួយ SCMP Knowledge ដែលជាវេទិកាថ្មីរបស់យើងនៃខ្លឹមសារដែលបានរៀបចំជាមួយនឹងការពន្យល់ សំណួរដែលសួរញឹកញាប់ ការវិភាគ និង infographic ដែលនាំមកជូនអ្នកដោយក្រុមដែលឈ្នះពានរង្វាន់របស់យើង។

សម្រាប់អ្នកតាមដានឧស្សាហកម្ម ឯកសាររបស់ DeepSeek ជារឿយៗផ្តល់នូវសញ្ញាដំបូងដ៏សំខាន់មួយនៃជម្រើសវិស្វកម្មដែលនឹងកំណត់រូបរាងនៃការចេញផ្សាយគំរូសំខាន់បន្ទាប់របស់ក្រុមហ៊ុនចាប់ផ្តើមអាជីវកម្ម។

នៅក្នុងឯកសារដែលបានចេញផ្សាយនៅថ្ងៃព្រហស្បតិ៍ ក្រុមអ្នកស្រាវជ្រាវ DeepSeek ចំនួន 19 នាក់បាននិយាយថា ពួកគេបានសាកល្បង mHC លើគំរូដែលមានប៉ារ៉ាម៉ែត្រចំនួន 3 ពាន់លាន 9 ពាន់លាន និង 27 ពាន់លាន ហើយបានរកឃើញថាវាត្រូវបានធ្វើមាត្រដ្ឋានដោយមិនបន្ថែមបន្ទុកគណនាសំខាន់ៗ។

អ្នកស្រាវជ្រាវដែលដឹកនាំដោយ Zhenda Xie, Yixuan Wei និង Huanqi Cao បានសរសេរថា "លទ្ធផលជាក់ស្តែងបញ្ជាក់ថា mHC មានប្រសិទ្ធភាព ... [អនុញ្ញាតឱ្យ] ការបណ្តុះបណ្តាលទ្រង់ទ្រាយធំដែលមានស្ថេរភាពជាមួយនឹងសមត្ថភាពធ្វើមាត្រដ្ឋានខ្ពស់ជាងបើប្រៀបធៀបទៅនឹង HC ធម្មតា (ការតភ្ជាប់អ៊ីពែរ)"។

លោក Liang ត្រូវបានចុះបញ្ជីជាអ្នកនិពន្ធចុងក្រោយ។

ក្រុមនេះបានបន្ថែមថា "យ៉ាងសំខាន់ តាមរយៈការបង្កើនប្រសិទ្ធភាពកម្រិតហេដ្ឋារចនាសម្ព័ន្ធប្រកបដោយប្រសិទ្ធភាព" mHC ផ្តល់នូវផលចំណេញទាំងនេះជាមួយនឹង "ការចំណាយលើការគណនាដែលមិនសំខាន់"។

ការបោះពុម្ពផ្សាយនេះក៏បានផ្តល់ភស្តុតាងថ្មីៗផងដែរថា លោក Liang ដែលរក្សាភាពស្ងប់ស្ងាត់ទោះបីជាមានកេរ្តិ៍ឈ្មោះកាន់តែខ្លាំងឡើងរបស់ DeepSeek ក៏ដោយ ក៏នៅតែចូលរួមយ៉ាងជិតស្និទ្ធក្នុងការស្រាវជ្រាវស្នូលនៅក្រុមហ៊ុន AI ដែលត្រូវបានតាមដានយ៉ាងដិតដល់បំផុតមួយរបស់ប្រទេសចិន។

ការតភ្ជាប់អ៊ីពែរត្រូវបានស្នើឡើងជាលើកដំបូងដោយអ្នកស្រាវជ្រាវ ByteDance ក្នុងខែកញ្ញា ឆ្នាំ 2024 ជាការកែសម្រួលទៅ ResNet (បណ្តាញសំណល់) - ស្ថាបត្យកម្មសិក្សាជ្រៅជ្រះដែលត្រូវបានណែនាំក្នុងឆ្នាំ 2015 ដោយអ្នកវិទ្យាសាស្ត្រ Microsoft Research Asia រួមទាំងអ្នកវិទ្យាសាស្ត្រកុំព្យូទ័រចិនដ៏ល្បីល្បាញ He Kaiming។

ResNet អាចឱ្យមានការហ្វឹកហ្វឺនបណ្តាញសរសៃប្រសាទជ្រៅខ្លាំងដោយធ្វើឱ្យការបណ្តុះបណ្តាលមានស្ថេរភាព ដូច្នេះព័ត៌មានសំខាន់ៗ ឬសំណល់ត្រូវបានរក្សាទុកនៅពេលដែលចំនួនស្រទាប់កើនឡើង។


វាបានក្លាយជាផ្នែកសំខាន់មួយនៃគំរូភាសាធំៗដូចជា GPT របស់ OpenAI ក៏ដូចជាប្រព័ន្ធ AlphaFold ដែលឈ្នះពានរង្វាន់ណូបែលរបស់ Google DeepMind។

ទោះជាយ៉ាងណាក៏ដោយ ResNet មានដែនកំណត់គួរឱ្យកត់សម្គាល់ រួមទាំងការលំបាកក្នុងការធានាថាសញ្ញាសិក្សាដែលហូរកាត់បណ្តាញសរសៃប្រសាទនៅតែរឹងមាំដោយមិន "ដួលរលំ" ទៅជាស្ថានភាពទំហំតែមួយសមនឹងទាំងអស់។

យោងតាមអ្នកស្រាវជ្រាវ DeepSeek ដំណោះស្រាយ HC របស់ ByteDance បានដោះស្រាយបញ្ហាទាំងនេះដោយជោគជ័យដោយពង្រីកស្ទ្រីមដែលនៅសេសសល់ និងបង្កើនភាពស្មុគស្មាញនៃបណ្តាញសរសៃប្រសាទ "ដោយមិនផ្លាស់ប្តូរបន្ទុកគណនានៃឯកតានីមួយៗ"។

ទោះជាយ៉ាងណាក៏ដោយ DeepSeek បានអះអាងថាវិធីសាស្រ្តមុននេះមិនបានគិតគូរពេញលេញចំពោះការកើនឡើងនៃថ្លៃដើមអង្គចងចាំនោះទេ ដោយបន្សល់ទុក "សមត្ថភាពធ្វើមាត្រដ្ឋានជាក់ស្តែង" របស់វាសម្រាប់ការហ្វឹកហ្វឺនគំរូធំ។

ផ្ទុយទៅវិញ ពួកគេបានស្នើការកែសម្រួលបន្ថែមដែល "រឹតបន្តឹង" បណ្តាញ HC ជាមួយនឹង manifold ជាក់លាក់មួយដើម្បីធានាបាននូវប្រសិទ្ធភាពនៃការគណនា និងថ្លៃដើម។

អ្នកស្រាវជ្រាវបានសរសេរថា "mHC នឹងជួយដោះស្រាយដែនកំណត់បច្ចុប្បន្ន និងអាចបំភ្លឺផ្លូវថ្មីសម្រាប់ការវិវត្តនៃស្ថាបត្យកម្មគ្រឹះជំនាន់ក្រោយ"។

ឯកសារនេះត្រូវបានផ្ទុកឡើងទៅក្នុងឃ្លាំងទិន្នន័យបើកចំហ arXiv ដោយលោក Liang Wenfeng នាយកប្រតិបត្តិ DeepSeek ផ្ទាល់ ដែលក៏បានបង្ហោះឯកសារបច្ចេកទេសលេចធ្លោជាងរបស់ DeepSeek ក្នុងប៉ុន្មានឆ្នាំថ្មីៗនេះ រួមទាំងការងារដែលភ្ជាប់ទៅនឹងម៉ូដែល R1 និង V3 របស់ខ្លួន។

ឯកសារផ្សេងទៀតដែលមិនសូវសំខាន់ជាធម្មតាត្រូវបានផ្ទុកឡើងដោយអ្នកស្រាវជ្រាវផ្សេងទៀត។

លោក Florian Brand និស្សិតបណ្ឌិតនៅសាកលវិទ្យាល័យ Trier របស់ប្រទេសអាល្លឺម៉ង់ និងជាអ្នកជំនាញខាងប្រព័ន្ធអេកូឡូស៊ី AI របស់ប្រទេសចិន បាននិយាយថា ឯកសាររបស់ DeepSeek ជារឿយៗដើរតួជាសញ្ញាដំបូងនៃទិសដៅបច្ចេកទេសនៅពីក្រោយម៉ូដែលជំនាន់ក្រោយរបស់ខ្លួន។

ការរំពឹងទុករបស់ឧស្សាហកម្មកំពុងកើនឡើងខ្ពស់ថា DeepSeek អាចចេញម៉ូដែលសំខាន់បន្ទាប់របស់ខ្លួននៅមុនថ្ងៃឈប់សម្រាកបុណ្យចូលឆ្នាំចិននៅពាក់កណ្តាលខែកុម្ភៈ។


ពីមុន ក្រុមហ៊ុនបានចេញម៉ូដែល R1 ដ៏ទំនើបរបស់ខ្លួននៅមុនថ្ងៃបុណ្យជាតិឆ្នាំមុន ដែលជំរុញឱ្យមានការរំពឹងទុកថាវាអាចធ្វើម្តងទៀតនូវសៀវភៅលេងនោះនៅឆ្នាំនេះ។

មេដឹកនាំហុងកុងសន្យាថានឹងជំរុញជីវភាពរស់នៅ និងពន្លឿនគម្រោងលំនៅដ្ឋាននៅឆ្នាំ ២០២៦

លោក Wang Yi របស់ប្រទេសចិនបានវាយប្រហារប្រទេសជប៉ុនក្នុងការសន្ទនាតាមទូរស័ព្ទជាមួយរដ្ឋមន្ត្រីការបរទេសកូរ៉េខាងត្បូង

ហុងកុងស្វាគមន៍ភ្ញៀវទេសចរច្រើនជាង ២៥% សម្រាប់ថ្ងៃចូលឆ្នាំថ្មីជាងឆ្នាំ ២០២៤

ហុងកុងបានព្រមានពីអាកាសធាតុត្រជាក់លើកដំបូង ខណៈដែលសីតុណ្ហភាពធ្លាក់ចុះដល់ ១២ ដឺក្រេ

អត្ថបទនេះដំបូងឡើយបានលេចឡើងនៅលើ South China Morning Post (www.scmp.com) ដែលជាប្រព័ន្ធផ្សព្វផ្សាយព័ត៌មានឈានមុខគេដែលរាយការណ៍អំពីប្រទេសចិន និងអាស៊ី។


Super Admin

Admin

សូម ចូលគណនី ដើម្បីបញ្ចេញមតិយោបល់លើអត្ថបទនេះ!

អ្នកក៏អាចចូលចិត្តផងដែរ