Их өгөгдөл & Аналитик

БИГ дата гэж юу вэ? | Tech-News.mn

“Их өгөгдөл”-ийг энгийнээр тайлбарлавал хэрэглэгч талаасаа бид өдөр тутам Google-с хэрэгтэй зүйлсээ хайдаг. Үүний ард бидний хайлтыг их хэмжээний өгөгдлүүдээс богино хугацаанд, оновчтой гүйцэтгэхэд асар олон тооны тооцоолох компьютерүүд ажиллаж байдаг. Харин бизнесүүдэд Google-н хайлт нь оновчтой, зорилтот хэрэглэгчдэд сурталчилгааг нь харуулахын тулд өөрт байгаа их хэмжээний өгөгдлүүдээс боловсруулалт хийн тохирох өгөгдлүүдийг хайн шинжилж хэрэглэгчдэд хүргэдэг.

Big Data буюу “Их өгөгдөл” гэж юу вэ? Үгийн утгаар нь бодвол ямарваа нэг зүйлийн талаарх маш их хэмжээний өгөгдөл гэж ойлгомоор ч юм шиг, эсвэл багтаамж өндөртэй нарийн төвөгтэй өгөгдөл ч юм шиг.  Үнэндээ “Их өгөгдөл” нь мэдээллийн эрин зуунд улс орон болон үндэстэн дамнасан компаниуд, технологийн гигантуудын бүх зүйлсийн талаар илүү ихийг мэдэх хүсэлд тулгуурласан эрэл хайгуулд үүссэн асар их хэмжээний өгөгдөл, түүнтэй холбогдох бүх ойлголтуудын нэгдэл гэж ойлгож болно. Үүнд өгөгдлийг олж авах, бүтээхээс эхлээд боловсруулах, хайх, түгээх, дамжуулах, шинжлэх, визуал болгох, хамгаалах зэрэг үйлдлүүд орно.

ИХ ӨГӨГДӨЛ-г хэрхэн тодорхойлох вэ?

Тэгвэл бид яг юуг буюу ямар өгөгдлийг ИХ ӨГӨГДӨЛ гэж ойлгож болох вэ? Энэхүү асуултын хариултыг ИХ ӨГӨГДӨЛ-г тодорхойлогч 5V-р тайлбарлая.

1. Volume — Тодорхой хугацааны туршид үүсгэгдэж байгаа өгөгдлийн хэмжээ юм. Дэлхий дээр нийт 6 орчим тэрбум хүн гар утастай бөгөөд түүгээр дамжин дата үүсгэгдэж байдаг. Монголд л гэхэд И-баримтын систем нь секунд бүр бидний худалдан авалтын мэдээллийг авч хадгалж байдаг бол интернэт сүлжээний компаниуд бидний хэрэглээний мэдээллийг мөн цуглуулж байдаг. Харин өдөр тутам бидний ашигладаг Фэйсбүүк нь бидний ямар мэдээлэл үзэж байгаа, ямар мэдээлэлд хариу үйлдэл (reaction) үзүүлсэн, ямар мэдээлэл хадгалж байгаа зэрэг мэдээллийн авч байдаг.

2. Velocity — Их хэмжээний өгөгдлийг цуглуулна гэдэг нь тус өгөгдлүүдийг ачаалах, боловсруулах, шинжлэх чадамж хурдтай байх ёстой. Жишээ нь: Нью-Йоркын хөрөнгийн бирж 1 терабайт хэмжээтэй арилжааны мэдээллийг боловсруулах чадамжтай.

3. Variety: Хуримтлагдсан байгаа нийт өгөгдлүүдийн ялгаатай байдал буюу өгөгдлүүд нь бүтэцлэгдсэн, бүтэцлэгдээгүй болон и-мэйл, аудио, видео, санхүүгийн гүйлгээ гэх мэт. Жишээ нь: Сар бүр Facebook-т 30 тэрбум контент шейр хийгддэг бол, Youtube -д 4 тэрбум цагийн бичлэг үзэгддэг. Харин Twitter-т өдөр 200 сая гаруй идэвхтэй хэрэглэгчийн 400 сая гаруй жиргээ нийтлэгддэг. Эдгээр контентууд нь видео, аудио, зураг, текст гэх мэт ялгаатай.

4. Value — Хуримтлагдаж байгаа өгөгдлүүд нь бүгд ямар нэг байдлаар эргээд үнэ цэнэ, өгөөж өгөхүйц байх хэрэгтэй билээ. Хэрэггүй, ашиглагдахгүй өгөгдлүүд нь “Их өгөгдөл” болж чадахгүй юм.

5. Veracity — Хуримтлагдаж буй өгөгдлүүд нь дээр дурдсанчлан хэрэглэгдэхүйц үнэ цэнэтэй байхын зэрэгцээ үнэн бодитой байх хэрэгтэй. “Их өгөгдөл”-н үндсэн зорилгын нэг бол шийдвэр гаргалтын оновчтой байдлын нэмэгдүүлэхэд оршдог бөгөөд ашиггүй, худал өгөгдөл нь сайн үр дүн мэдээж авч ирэхгүй. Жишээ нь: АНУ-н эдийн засагт жилд 3,1 их наяд доллар poor data буюу хэрэгцээгүй өгөгдөлд зарцуулагддаг.

“Их өгөгдөл”-тэй ажиллах ямар технологи байдаг вэ?

“Их өгөгдөл”-тэй ажилладаг хамгийн нийтлэг бөгөөд шалгарсан технологи бол Hadoop юм. Apache-с гаргасан эх өгөгдлийн технологи болох Hadoop нь найдвартай ажиллагаатай, өргөтгөх боломж бүхий Opensource технологи юм. Нэг серверийг олон тооны машинаар өргөтгөх боломжтой буюу их хэмжээний өгөгдлийг тус олон тооны машинуудад байршуулан ачаалуулдаг. Найдвартай ажиллагааны хувьд энэ нь олон тооны машин зэрэг ажиллаж байгаа бөгөөд аль нэг нь ажиллагаагүй болсон тохиолдолд түүнтэй холбогдож байсан программ хангамж өөр машинтай холбогдон үйл ажиллагаагаа хэвийн үргэлжлүүлэн ажилладгаараа онцлог юм. Жишээ нь: Google бидний хайлтыг түргэн хугацаанд гүйцэтгэхийн тулд энэ технологийг ашигладаг.

“Их өгөгдөл”-ийн хэн, ямар салбарт ашиглаж байгаа вэ?”

Банк — “Их өгөгдөл”-г түлхүү ашиглаж байгаа салбар бол банк билээ. Банкнууд харилцагчдадаа ямар төрлийн үйлчилгээ, бүтээгдэхүүн санал болгох, харилцагдаа ялгаатай бүлэг болгон ангилах, шинээр болон нэмэлтээр зээл олгох, сэжигтэй болон луйврын гүйлгээнээс болон бусад эрсдэлүүдээс урьдчилан сэргийлэхэд ашиглаж байна.

Засгийн газар — Мэдээж “Их өгөгдөл”-г ашиглах зайлшгүй шаардлагатай газар бол Засгийн газар юм. Улс орны өнөөгийн байдлыг тодорхойлох, төлөвлөгөө, төлөвлөлт хийхэд түлхүү ашиглахын зэрэгцээ ил тод байдлыг нэмэгдүүлэх, гэмт хэргийг буруулах, эрүүл мэндийн төлөв байдал зэргийг оновчтой тодорхойлоход ашиглаж байна.

Боловсрол — Боловсролын байгууллагууд мөн “Их өгөгдөл”-г түлхүү ашиглаж байна. Сургалтын чанар, үнэлгээ болон суралцагчдын төлөв байдал, сургалтын системийн хүртээмжтэй байдал зэргийг тодорхойлоход ашигладаг.

Үйлдвэрлэл, Худалдаа — Үйлдвэрлэл болон худалдааны байгууллагуудын нь бараа бүтээгдэхүүний төлөвлөлт, татан авалт болон маркетингийн оновчлол, оновчтой шийдвэр гаргахад ашиглаж байна.

“Их өгөгдөл”-н хүндрэл юу вэ?

“Их өгөгдөл”-г ашиглана гэдэг нь байгууллага бүрийн хувьд боломжтой биш бөгөөд хэд хэдэн хүндрэл тулгарна. Үүнд:

Боловсруулалт — “Их өгөгдөл”-г боловсруулалт хийнэ гэдэг нь амаргүй зүйл бөгөөд техник, тоног төхөөрөмж зэргийг хувьд ихээхэн хүндрэлүүдтэй учирч болзошгүй.

Хадгалах, Нөөцлөх — Нэрийг нь уншихад л ИХ гэдэг үг орсон байгаа бөгөөд “Их өгөгдөл”-г хадгалж, нөөцлөх нь хүндрэлтэй.

Хайх — “Их өгөгдөл”-с хайлт хийнэ гэдэг нь мөн л техник, төхөөрөмжийн байдлаас хамаарах бөгөөд Google шиг ажиллагаатай биш л бол хайлт хийх нь хүндрэлтэй.

Хуваалцах, Шилжүүлэх — “Их өгөгдөл”-г шилжүүлэх, өөр нэг байгууллагатай хуваалцана гэдэг нь маш ажиллагаатай юм.

Мэдээж хэрэг техник, төхөөрөмж, ажиллах чадамж, хүний нөөц зэрэг нь хангалттай бол эдгээр хүндрэлүүд нь учрахгүй.

Эх Сурвалж: Цэнгэл Ганбаатар

Санал болгох

Сэтгэгдэл

АНХААРУУЛГА: Уншигчдын бичсэн сэтгэгдэлд Tech-news.mn хариуцлага хүлээхгүй болно. Манай сайт ХХЗХ-ны журмын дагуу зүй зохисгүй зарим үг, хэллэгийг хязгаарласан тул Та сэтгэгдэл бичихдээ бусдын эрх ашгийг хүндэтгэн үзнэ үү.

Back to top button
error: Хамгаалагдсан !!