Их өгөгдөл & Аналитик

Их хэмжээний мэдээлэлд дүн шинжилгээ хийх – MACHINE LEARNING

Юуны өмнө машин сургалт л гэвэл шууд их хэмжээний өгөгдлийг бодох хэрэгтэй. Машин сургалтыг энгийнээр маш их хэмжээний мэдээлэлд дүн шинжилгээ хийх гэж хэлж болно. Хүнээр жишээ авбал олон жил ногоо тарьсан хүн төмсний үр, луувангийн үрнээс ургадаг цэцгийг хооронд нь ядах юмгүй таньж чадна. Цаана нь мэдээж тэр хүний тархинд олон жил цугларсан мэдээлэл аль нь аль вэ гэдгийг хэлэхэд бүрэн үүрэг гүйцэтгэж байгаа. Машин сургалт бол яг энэ зарчмийг ашигладаг.

Компьютерийг туршлага дээрээс суралцдаг болгон програмчлах нь програмчлалын маш их хүнд асуудлуудыг эцэслэх болно. Артур Самуел (1959)-Компьютерийн шинжлэх ухааны эрдэмтэн

Машин сургалтын ажиллах зарчим

Өгөгдлүүд болон өгөгдөл бүрт тохирох хариултуудыг машинд оруулна
Машин сургалтад ашигладаг тодорхой алгоритмуудаас үр ашигтайг нь сонгон авч машиныг програмчлана.
Тодорхой дүрэмд суурилсан машин сургалтын загвар ажиллахад бэлэн болно.
Машин луу шинээр өгөгдөл оруулна.
Машин сургалтын загвар тохирох хариултыг боловсруулан харуулна.
Машин сургалтыг яагаад сонгох ёстой вэ?

Машин сургалтын загвар нь нэгэнт өгөгдөлд суурилан сургагдсан тохиолдолд танд хэрэгтэй үр дүнг хормын төдийд бодож чадна. Хэрэв та Youtube ашиглаж үзсэн бол нэг бичлэгээс нөгөөд шилжих хооронд л дараа дараагийн шинэ бичлэгүүдийг санал болгосоор байдгийг анзаарсан байх. Youtube-д нийт сая саяаар тоологдохуйц олон бичлэг байгаа гэж үзэхэд л их хурдан байгаа биз? Машин сургалтын алгоритм ашиглахгүйгээр энэ үр дүнг хамгийн тохиромжтой, хурдацтай гаргах програм бичихийн тулд хэр их хүчин чармайлт орох талаар хэлж мэдэхгүй нь дээ.

Мөн машин сургалтыг ашиглахын тулд түүний цаана буй бүх математик ойлголтыг програмчлах шаардлага огт үүсэхгүй. Аль хэдий нь ашиглахад бэлэн програмчлалын сангууд нээлттэй лицензтэй байдаг тул програмчлалын талаар ойлгодог хүмүүс барьж аваад хийхэд тийм ч их хүч хөдөлмөр зарахгүй.

Машин сургалтын үндсэн 2 төрөл

Ногоо тарьдаг хүний жишээ рүү эргээд оръё. Ногоочин маань ногоонуудыг хооронд нь ангилах чадвараа яадаг ч байлаа гэсэн 2 боломжийн аль нэгээр нь сурсан байх боломжтой. Гадарлаж байна уу? Нэг нь түүнд хэлж зааварлах хүмүүс, ном, сонингийн тусламжтайгаар аль нь аль вэ гэдгийг суралцсан байж болох. Эсвэл дэлхий дээрх анхны ногоочин маань өөрийн туршлагаар бүх зүйлсийг шинээр ангилж, нэрийдсэн байх 2-хон сонголт байгаа юм. Өөрийн биеэр сурсан тохиолдолд мэдээж их хугацааг зарцуулах нь дамжиггүй бөгөөд мань хүн төмсийг төмс гэж нэрлээгүй бол бид одоо төмс биш өөр юу ч гээд явж байж болох.

Машиныг сургах процесс бас энэ 2 төрөлд хамаарагдах бөгөөд түүнийг Supervised, Unsupervised learning хэмээн нэрийддэг. Аль төрлөөр сурахаас шалтгаалан машины маань сурах их үйлсэд хязгаар бас үүснэ гэдгийг анхаарах хэрэгтэй.

Машин сургалтын төрөл, Хэрэглээ, Алгоритм

Ямар сургалтын алгоритм, арга техник ашиглахаас хамааран үр дүн харилцан адилгүй байх бөгөөд бүхнийг гүйцэтгэгч универсал алгоритм одоогоор машин сургалтын ертөнцөд байхгүй. Үүнийг “Үнэгүй хоол гэж үгүй” хэмээн нэрийддэг бололтой юм.

Чиглүүлсэн сургалт — Supervised learning

Чиглүүлсэн сургалтад Таамаглал, Ангилалын асуудлууд багтах бөгөөд түүнд холбогдох шугаман, К тооны ойрхон хөрш, Шийдвэрийн мод гэх мэт алгоритмууд оршино.

Таамаглал

Таамаг гаргахын тулд Юун дээр үндэслэж, Юуг таамаглах вэ? гэдэг хамгийн эхэнд тавигдах асуулт байх ёстой. Дээрх зурагт байшингийн хэмжээ болон үнийн хамаарлийг дүрслэн харуулсан бөгөөд хэмжээ ихсэх тусам үнэ ихсэж байгааг ажиглаж болж байна. График дээрх цэгүүд бол бодит мэдээллийн тэмдэглэгээ бөгөөд дундуур нь татсан шугам бол хамаарлыг илтгэх шугаман функц юм. Яг үнэндээ энэ шугаман функц бол бидний сургасан машин бөгөөд хотын төвд тэдэн метр квадрат байшин авмаар байнаа хэд болох нь вэ? гээд асуухад энэ шугаман функцийн налуу, огтлолцын цэгийг мэдээд авчихсан дунд ангийн хүүхэд хялбархан хэлээд өгнө. Гэхдээ мэдээж харагдаж байгаа шигээ биш. Хотын төвөөс зайтай юу? Халуун хүйтэн устай юу? гээд шалгаах тусам энэ шугамыг олно гэдэг чөтгөрийн тойрог шиг юм болж хувирах вий!

Ангилал

Түрүүнийхтэй л ойролцоо. Хэдэн цэгүүд тэгээд нэг шугам байж л байна. Тэр шугамын мэдээллийг олчихвол тэгээд л машинаа сургачихаж байгаа юмдаа. Ер нь сургах бол амархан гээд хэлчихэд буруудахгүй. Аль мэдээлэл альтай хамааралтай байна. Зарим тохиолдолд худлаа мэдээлэл орж ирсэн бол яах вэ? гэх зэргийг шийдэх нь овоо хэцүү ажил санагдсан. Зураг дээрх однуудыг ханиад, цэгүүдийг хатгай, Feature 1-ийг цээж хатгах түвшин, Feature 2-ийг халуурах түвшин гээд үзчихвэл тэр ангилж байгаа шугам бараг л гарчих болов уу?

Чиглүүлээгүй сургалт — Unsupervised learning

Энэ тохиолдолд хэний юу нь мэдэгдэхгүй баахан л мэдээлэл оруулаад хаячихад тодорхой хэдэн машин сургалтын алгоритмын тусламжтай сургасан загвар маань ижил төстэй зүйлсийг нэг бүлэг гэж авч үзээд юу ч гэж нэрийдсэн өөрийнх нь дур байх нь. Үүнийг одоогийн байдлаар нарийн судлаагүй учир хангалттай хэлээд өгөх юм алга. Минийхээр google photos үүнийг ашигладаг нэг жишээ нь юм уу даа. Холоос ойроос янз янзаар авсан зурагнуудаас хажуугаас, урдаасаа гарсан хүний царайнуудыг бүлэглээд ямар ч байсан нэг хүн гэдгийг нь олж тогтоочихоод хэн гэж нэр өгөх вэ гээд л асуугаад байдаг юм. Ойр дотныхоо хэдэн хүний нэрийг зоож орхичихоод дараа нь түүгээрээ хайхад л гялтайтал гараад ирнэ дээ.

Машин сургалт хаана ашиглагддаг вэ?

Машин сургалт нь хэдийгээр статистик болон хэрэглээний математикийн онол, ойлголт боловч түүнийг програмчласнаар бодит амьдралд хэрэгжүүлэх боломж бүрддэг. Машин сургалтыг ашигладаг хэд хэдэн жишээг дурдвал:

Үнэлгээ — Интернэтээр хайлт хийж буй хүмүүст хамгийн тохиромжтой хайлтуудыг харуулах (Google, Amazon …) Санал болгох — Хэрэглэгчдэд хамгийн сонирхолтой байж болох зүйлсийг санал болгох. (Сурталчилгаа, Бараа бүтээгдэхүүн) Ангилал — Эд зүйлсийг ямар ангилалд багтахыг олж тогтоох Таамаглал — Ямар нэг зүйлийн тоон утгыг таамаглах (Байшингийн үнэ) Бүлэглэх — Ижил төстэй зүйлсийг хамтатгах Сэжигтэй зүйл илрүүлэх — Зарим нийтлэг бус зүйлсийг олж тогтоох (Муудсан хүнс)

Эх сурвалж: Knowledge.hackum.club

 

Санал болгох

Сэтгэгдэл

АНХААРУУЛГА: Уншигчдын бичсэн сэтгэгдэлд Tech-news.mn хариуцлага хүлээхгүй болно. Манай сайт ХХЗХ-ны журмын дагуу зүй зохисгүй зарим үг, хэллэгийг хязгаарласан тул Та сэтгэгдэл бичихдээ бусдын эрх ашгийг хүндэтгэн үзнэ үү.

Back to top button
error: Хамгаалагдсан !!