Vision transformers ដឹកនាំបដិវត្តន៍ថ្មីនៃការបើកបរដោយស្វ័យភាព

756
Visual Transformer (ViT) បានបង្ហាញខ្លួននៅក្នុងវិស័យនៃការបើកបរដោយស្វ័យភាព ដោយសារតែសមត្ថភាពសិក្សាលក្ខណៈសកល និងយន្តការនៃការយកចិត្តទុកដាក់លើខ្លួនឯង។ វាអាចចាប់យកភាពអាស្រ័យរយៈចម្ងាយឆ្ងាយក្នុងរូបភាពបានយ៉ាងមានប្រសិទ្ធភាព ដោយអាចឱ្យរថយន្តធ្វើការសម្រេចចិត្តបានត្រឹមត្រូវក្នុងបរិយាកាសស្មុគស្មាញ។ កម្មវិធី ViT មិនត្រូវបានកំណត់ចំពោះការរកឃើញ និងការទទួលស្គាល់គោលដៅនោះទេ ប៉ុន្តែរួមបញ្ចូលផងដែរនូវការធ្វើផែនការផ្លូវ ការសម្រេចចិត្តក្នុងការបើកបរ និងទិដ្ឋភាពផ្សេងទៀត ដែលបង្ហាញពីសក្តានុពលដ៏អស្ចារ្យរបស់វានៅក្នុងប្រព័ន្ធជំនួយការបើកបរ។