ML Completeness шалгах хуудас

2025 Зохиолч: Timothy Dodson | [email protected]. Хамгийн сүүлд өөрчлөгдсөн: 2025-01-22 21:37

Нөхөн үржих чадварыг дээшлүүлэх, хэвлэгдсэн бүтээлийг илүү хялбархан бүтээх чадварыг бусдад олгох зорилгоор ML кодын бүрэн байдлын хяналтын хуудсыг толилуулж байна. ML Code Completeness Checklist нь кодын дэлгүүрийг түүнд оруулсан скриптүүд болон олдворууд дээр үндэслэн үнэлдэг.

ML кодын бүрэн бүтэн байдлыг шалгах жагсаалт

Танилцуулга

Өнгөрсөн жил Жоэл Пино томоохон OA бага хурлуудад (NeurIPS, ICML,…) танилцуулсан нөхөн сэргээгдэх судалгааг хөнгөвчлөх зорилгоор нөхөн үржихүйн хяналтын жагсаалтыг гаргасан. Хяналтын жагсаалтад багтсан ихэнх зүйл нь цаасан дээрх бүрэлдэхүүн хэсгүүдэд төвлөрдөг. Энэхүү хяналтын жагсаалтад багтсан нэг зүйл бол “эх кодын холбоосыг өгөх” боловч үүнээс өөр цөөн хэдэн зөвлөмж гаргасан болно.

Шилдэг туршлагуудыг ML Code Completeness Checklist-т нэгтгэн харуулсан бөгөөд одоо NeurIPS 2020 кодыг албан ёсоор ирүүлэх үйл явцын нэг хэсэг болсон бөгөөд хянагч нар өөрсдийн хүссэнээр ашиглах боломжтой болно.

ML Completeness шалгах хуудас

M Code Completeness Checklist нь код хадгалах газрыг дараахь байдлаар шалгадаг.

Хараат байдал - Репозиторт хараат байдлын мэдээлэл эсвэл орчныг хэрхэн тохируулах заавар байдаг уу?
Сургалтын хувилбар - Репозитор нь баримт бичигт дурдсан загваруудыг сургах / тохируулах арга замыг агуулдаг уу?
Үнэлгээний хувилбарууд - Сургуульд бэлтгэгдсэн загвар (ууд) -ын гүйцэтгэлийг тооцоолох эсвэл загвар дээр туршилт хийх скрипт агуулагдаж байна уу?
Урьдчилан тохируулсан загварууд - Репозитор нь урьдчилж бэлтгэсэн загварын жинд үнэгүй нэвтрэх боломжийг олгодог уу?
Үр дүн - агуулахад үндсэн үр дүнгийн хүснэгт / график болон эдгээр үр дүнг хуулбарлах скрипт орсон уу?

Агуулах бүр 0 (байхгүй) -ээс 5 (бүгд байна) хачиг авах боломжтой. Зүйл бүрийн шалгуурын талаархи дэлгэрэнгүй мэдээллийг Github сангаас олж болно.

Хяналтын жагсаалтын зүйлүүд илүү ашигтай агуулахад хувь нэмэр оруулдаг нотолгоо юу вэ?

Олон нийт GitHub оддыг репозитор болгон ашиглахад прокси болгон ашигладаг. Тиймээс ML-ийн бүрэн байдлыг шалгах жагсаалтад илүү өндөр оноо авсан репо нь GitHub-ийн одод илүү их байх төлөвтэй байна. Энэхүү таамаглалыг шалгахын тулд NeurIPS 2019 баримт бичигт 884 GitHub репо албан ёсны хэрэгжилт болгон ирүүлсэн бөгөөд эдгээр 884 репогийн 25% дэд хэсгийг санамсаргүй байдлаар сонгож, ML-ийн бүрэн байдлыг шалгах жагсаалтад гараар шалгаж үзсэн болно. Тэд энэхүү түүвэр NeurIPS 2019 GitHub репо-г ML кодын бүрэн байдлын хяналтын хуудсанд байгаа хачигны тоогоор бүлэглэж, бүлэг тус бүрт GitHub медиан оддын зураглал хийжээ. Үр дүн доор байна:

0 хайрцаг бүхий NeurIPS 2019 репо нь GitHub дээр 1.5 одтой медиантай байв. Үүний эсрэгээр 5 хайрцаг бүхий репо нь 196.5 GitHub оддын медианатай байв. Репогийн дөнгөж 9% нь 5 хачигтай байсан бөгөөд ихэнх репогийн (70%) 3 ба түүнээс бага хачигтай байжээ. Wilcoxon-ийн зэрэглэлийг тогтоох шалгалтыг хийж 5 хачигт ангийн оддын тоо 5-аас 4-ээс бусад бүх ангиас хамаагүй (p.value <1e-4) илүү байгааг тогтоожээ (p.value нь хил хязгаар юм). 0.015 дээр). Та энэ зургийн өгөгдөл, кодыг Github агуулахаас харах боломжтой.

Энэ харилцаа илүү өргөн цар хүрээтэй байгаа эсэхийг шалгахын тулд README репозитор болон холбогдох кодоос шалгах жагсаалтыг тооцоолох ажлыг автоматжуулах скриптийг үүсгэсэн. Дараа нь бид 884 NeurIPS 2019 агуулах бүхэлд нь, мөн 2019 онд хэвлэгдсэн ML-ийн бүх нийтлэлийн 8926 кодын агуулахын өргөн багцад дахин дүн шинжилгээ хийлээ. Аль ч тохиолдолд мэргэжилтнүүд чанарын хувьд ижил үр дүнг статистикийн ач холбогдол бүхий хачигнаас монотоноор өссөн медиан одод олж авсан (p.value <1e-4). Эцэст нь бат бөх шугаман регрессийг ашиглан урьдчилж боловсруулсан загвар, үр дүнг GitHub одод хамгийн их эерэг нөлөө үзүүлсэн болохыг олж мэдлээ.

Үүнийг шинжээчид ML-ийн бүрэн бүтэн байдлын хяналтын хуудсанд шаардагдах бүх бүрэлдэхүүн хэсгүүдийг оруулахыг уриалж байгаа нь илүү ашигтай агуулахуудыг бий болгоход түлхэц өгч, хяналтын хуудсан дээрх оноо нь илүү чанартай материал ирүүлсэн болохыг харуулж байна гэж шинжээчид үзэж байна.

Одоогийн байдлаар шинжээчид санал болгож буй хяналтын хуудасны 5 зүйл нь репозиторыг түгээмэл байлгах цорын ганц, тэр ч байтугай хамгийн чухал хүчин зүйл гэж үзэж байна. Шинжлэх ухааны хувь нэмэр оруулах хэмжээ, маркетинг (ж.нь блогын нийтлэл, твиттер дэх бичлэг), баримт бичиг (дэлгэрэнгүй README, заавар, API баримтжуулалт), кодын чанар, өмнөх ажил зэрэг бусад хүчин зүйлүүд нь нэр хүндэд нөлөөлж болно.

5 хайрцаг бүхий NeurIPS 2019 агуулахуудын зарим жишээ:

Мэргэжилтнүүд хяналтын хуудсыг аль болох ерөнхийд нь оруулахыг хичээсэн боловч энэ нь бүх төрлийн баримт бичигт, тухайлбал, онолын болон баримт бичгийн багцад бүрэн хамаарахгүй байж болохыг хүлээн зөвшөөрдөг. Гэсэн хэдий ч, өгүүллийн гол зорилго нь мэдээллийн санг төлөөлөх байсан ч сургалтын хувилбар, үнэлгээний хувилбар, үр дүнг багтаасан суурь загваруудыг гаргахад ашиг тусаа өгөх болно.

Ашиглаж эхэлнэ үү

Хянагч, хэрэглэгчдэд агуулахад юу байгааг ойлгоход хялбар, шинжээчид үүнийг зөв үнэлэхэд хялбар болгох үүднээс README.md файлыг бичих, хамаарлыг тодорхойлох, урьдчилан бэлтгэсэн загвар, мэдээллийн багц, үр дүнг гаргах шилдэг туршлагын цуглуулгыг өгдөг. Репозитордоо эдгээр 5 элементийг тодорхой тодорхойлж, баримт бичиг, тэргүүлэгчдийн самбар гэх мэт гадны аливаа эх үүсвэртэй холбож, хэрэглэгчдэд илүү их контекст, ойлгомжтой байлгахыг зөвлөж байна. Эдгээр нь NeurIPS 2020-д код илгээх албан ёсны удирдамж юм.

Зөвлөмж болгож буй:

Word дээр Cheat хуудас хэрхэн хийх вэ

Cheat хуудас нь зөвлөмж бүхий жижиг цаас юм. Өнөө үед cheat хуудсыг гараар бичих шаардлагагүй болсон тул бүх зүйлийг Microsoft Office Word текст засварлагчаар хийх боломжтой болжээ. Хамгийн гол нь аль хэрэгслийг ашиглахаа мэдэх явдал юм. Зааварчилгаа 1-р алхам Word баримт бичгийг нээхэд cheat хуудас дахь ямар ч сул зай илүүдэл байх болно гэдгийг анхаарч үзвэл хамгийн эхний зүйл бол захын хэмжээг тохируулах явдал юм

Jpg-ийг Pdf болгон олон хуудас болгон хөрвүүлэх

PDF формат гарч ирснээс хойш график болон текстийн өгөгдлийг хослуулан ашигладаг тул бүх ур чадварын түвшний хэрэглэгчдийн дунд хамгийн уян хатан, түгээмэл хэрэглэгддэг болжээ. Үнэндээ түүний хэмжээ маш бага, жишээлбэл, хэрэв бид үүнийг график форматтай харьцуулж үзвэл

Хэрхэн гоё нэрийн хуудас хийх вэ

Нэрийн хуудсыг өндөр чанартай хэвлэх цаас, картон эсвэл хуванцар, заримдаа бүр төмөр эсвэл модоор хийдэг. Энэ нь эзэмшигчтэй холбоотой холбоо барих мэдээллийг агуулдаг - тодорхой хүн эсвэл байгууллага. Нэрийн хуудасны хэмжээг зохицуулдаг хэд хэдэн стандарт, түүнчлэн тэдгээрийн дизайны талаархи олон нийтийн онцлог удирдамж байдаг

Хэвлэгч яагаад хоосон хуудас хэвлэдэг вэ?

Заримдаа, баримт бичгийг хэвлэх үед принтер хоосон хуудас хэвлэж болно. Энэ нь хэд хэдэн шалтгаанаас үүдэлтэй байж болно, жишээлбэл хэвлэгч өөрөө доголдсон, хайрцгандаа хор байхгүй, эсвэл хоосон баримт хэвлэхээр илгээсэн. Нэгдүгээрт, хоосон баримт хэвлэхээр илгээгээгүй гэдгээ шалгаарай

Фотошоп дээр ухуулах хуудас, сурталчилгаа, сурталчилгааны хуудас эсвэл нэрийн хуудсыг хэрхэн яаж хийх вэ

Товхимол бий болгох нь үйл ажиллагааны олон салбаруудын огтлолцол бүхий ажил мэргэжил юм: дизайн, хэвлэх, уран бичлэг гэх мэт. Хэрэгсэл болохын хувьд бид танилтай багс, захирагч, луужин хоёуланг нь ашигладаг бөгөөд сүүлийн жилүүдэд технологийн дэвшлийн үр жимс болох програм хангамжийг ашигладаг

ML Completeness шалгах хуудас

Агуулгын хүснэгт:

Танилцуулга

ML Completeness шалгах хуудас

Хяналтын жагсаалтын зүйлүүд илүү ашигтай агуулахад хувь нэмэр оруулдаг нотолгоо юу вэ?

Ашиглаж эхэлнэ үү

Зөвлөмж болгож буй:

Word дээр Cheat хуудас хэрхэн хийх вэ

Jpg-ийг Pdf болгон олон хуудас болгон хөрвүүлэх

Хэрхэн гоё нэрийн хуудас хийх вэ

Хэвлэгч яагаад хоосон хуудас хэвлэдэг вэ?

Фотошоп дээр ухуулах хуудас, сурталчилгаа, сурталчилгааны хуудас эсвэл нэрийн хуудсыг хэрхэн яаж хийх вэ

Packard хонхны зөөврийн компьютер нь ямар брэнд вэ?

Зургийг Ipad дээр хэрхэн байршуулах талаар

P10 таблет гэж юу вэ?

Java дэмжлэгийг хэрхэн суулгах талаар

IPad Mini ямар харагддаг вэ?

Сэнсийг хэрхэн тослох вэ?

Компьютерийн тэжээлийн хангамжийг хэрхэн яаж засах вэ

Компьютерийн тэжээлийг хэрхэн солих вэ

Чулууг залгуурт хэрхэн яаж оруулах вэ

Сэлбэг хэрэгслийн зөөврийн компьютерийг хаана буцааж өгөх вэ

Файлаас хамгаалалтыг хэрхэн арилгах

Линуксийг зөөврийн компьютер дээрээ хэрхэн яаж байрлуулах вэ

Дотоод ТВ тааруулагчийг хэрхэн яаж холбох вэ

Vista ичгүүрийг хэрхэн идэвхжүүлэх

Тодорхой цагт компьютерээ хэрхэн унтраах вэ