3.1 Төрийн байгууллагаас нээлттэй өгөгдөл бий болгох жишиг алхмууд
3.1 Төрийн байгууллагаас нээлттэй өгөгдөл бий болгох жишиг алхмууд
Алхам 1. НЭЭЛТТЭЙ ӨГӨГДЛИЙГ СОНГОХ
1.1. Байгууллага өгөгдлийн тооллогыг хэрхэн хийх вэ?
Өгөгдлийн тооллого нь байгууллагын чиг үүргийн хүрээнд үүсэж, цугларч, хадгалагдаж буй өгөгдлийг бүрэн хамруулан бүртгэх, ангилан тодорхойлох үйл ажиллагаа бөгөөд дараах аргачлалуудыг ашиглаж болно. Үүнд:
- Газар, хэлтэс, нэгж болон албан хаагч буюу өгөгдлийг үүсгэгч, хариуцагчаар нь хөөж тоолох;
- Байгууллагын үйл ажиллагаа, үйлчилгээ, процессоор нь ангилан бүртгэх;
- Байгууллагын цахим хуудас, мэдээллийн систем, бүртгэл, тайлан, архив, албан хаагчдын компьютер болон дотоод сүлжээнд хадгалагдаж буй мэдээллийг нягтлан шалгах замаар тооллого хийх;
Өгөгдлийн тооллого хийснээр дараах мэдээллүүд тодорхой болно. Үүнд:
- Өгөгдлийн нэр;
- Ашигласан нэр томьёо, ангилал, код;
- Цуглуулах, тооцох аргачлал;
- Цуглуулах, тооцох давтамж;
- Өгөгдлийн урсгалыг тодорхой болгох.
Ингэснээр байгууллага доторх өгөгдлийг хянахад хялбар болох ба тэдгээрээс нээлттэй болгох өгөгдлийг сонгоход илүү амар болно.
Өгөгдлийн нэр тодорхойлох
**Ашигласан нэр томьёо, ангилал, кодыг бүртгэх **
2.1.9.хууль тогтоомжоор зөвшөөрсөн, шинжлэх ухааны үндэслэл бүхий, энгийн, ойлгомжтой, нийтлэг хэрэглэгддэг нэр томьёо, агуулга, тоо, үсэг, тусгай тэмдэглэгээ ашигласан байх;
2.1.5.мэдээллийн сангийн нэгдсэн ангилал, код ашигласан байх;
**Цуглуулах, тооцох аргачлал тодорхойлох **- Доорх асуултуудаар тодорхойлох боломжтой. Үүнд:
- Хэн цуглуулдаг вэ?
- Ямар эх сурвалжаас?
- Ямар шалгуураар бүртгэдэг вэ?
- Тооцоолол хийдэг үү? гэх мэт. Энэ нь найдвартай байдлыг хангадаг.
Тухайн байгууллагад өгөгдөл хэрхэн бий болж байгаа эх сурвалжийг шинжлэх шаардагатай.
Цуглуулах, тооцох давтамж тогтоох - бодит цаг, сар бүр, улирал, жил гэх мэт. Үүгээр шинэчлэлийг хянах боломжтой.
Өгөгдлийн урсгал зураглах - Доорх асуултуудаар тодорхойлох боломжтой. Үүнд:
- Хаана үүсдэг вэ?
- Хаана хадгалагддаг вэ?
- Хэн ашигладаг вэ?
- Гадагш тайлагнадаг уу? гэх мэт. Энэ нь ил тод байдлыг хангана.
**Жишээ нь: **Аймгийн Засаг даргын Тамгын газарт “Газрын зөвшөөрлийн бүртгэл”-ийн өгөгдлийн бүрдэл (dataset)
Үзүүлэлт
Тайлбар
Өгөгдлийн нэр
Газрын зөвшөөрлийн бүртгэл
Нэр томьёо, код
LO1(өмчлөл), LO2(ашиглалт)
Аргачлал
Өргөдөл хүлээн авах -> батлуулах -> бүртгэх -> дуусах
Давтамж
Бодит цаг
Урсгал
Иргэн->Газрын алба->Систем->Тайлан -> дуусах
1.2 Байгууллага өгөгдлийн эрэлтийг хэрхэн тодорхойлох вэ?
Төрийн байгууллага нь нээлттэй өгөгдлийг зөвхөн нийтлэх бус, бодит хэрэглээнд нэвтрүүлж, иргэн, хуулийн этгээд, судлаач, хувийн хэвшил, төрийн бусад байгууллага болон дотоод шийвэр гаргалтдаа үр өгөөжтэй ашиглах нөхцөлийг бүрдүүлэх нь чухал юм. Иймд нээлттэй болгох өгөгдлийг сонгохдоо хэрэглэгчдийн эрэлт хэрэгцээ, нийгмийн шаардлага, бодлогын хэрэгжилтийн хэрэгцээг харгалзан үзэх шаардлагатай.
Өгөгдлийн эрэлтийг дараах байдлаар тодорхойлж болно:
- Хүн, хуулийн этгээдийн хүсэлт;
- Оролцогч талуудтай уулзалт, хэлэлцүүлэг зохион байгуулах;
- Судалгаа авах;
- Нийгэмд тулгамдсан асуудалтай уялдуулан тодорхойлох.
1.3 Байгууллага нээлттэй өгөгдлөө хэрхэн сонгох вэ?
Байгууллага өгөгдлийн тооллогоо хийж эрэлт, нийлүүлэлтийг тодорхойлсны үр дүнд тухайн мэдээлэл хариуцагч байгууллагаас нээлттэй болгох боломжтой, хэрэглэгчийн хэрэгцээнд нийцсэн өгөгдлийн боломжит жагсаалт гарна. Гэвч эдгээр өгөгдөл нь шууд нээлттэй нийтлэхэд бэлэн гэсэн үг биш юм. Иймд өгөгдлийг нээлттэй болгох боломж, бэлэн байдалд тулгуурлан эрэмбэлж, эхний ээлжинд нийтлэх өгөгдлийг сонгох нь зүйтэй.
Өөрөөр хэлбэл, нээлттэй болгох өгөгдлийг дараах үндсэн шалгуурт тулгуурлан эрэмбэлж, үе шаттайгаар хэрэгжүүлнэ.
Өгөгдлийн хэрэглээ
- Иргэн, хуулийн этгээдийн эрэлт, давтамж;
- Олон нийтийн сонирхол, ил тод байдлыг нэмэгдүүлэх ач холбогдол;
- Нийгэм, салбарын тулгамдсан асуудлыг шийдвэрлэхэд хувь нэмэр оруулах боломж;
- Байгууллагын стратеги зорилго, чиг үүрэг, бодлогын хэрэгжилттэй уялдсан байдал.
Өгөгдлийн бэлэн байдал
- Өгөгдлийн бүрэн байдал, хамрах хүрээ;
- Үнэн зөв, баталгаажсан эсэх;
- Нээлттэй өгөгдлийн шаардлагад нийцүүлэн боловсруулахад шаардагдах хугацаа, зардал;
- Шаардлагатай хүний нөөц, техник технологийн боломж;
- Хувийн мэдээлэл, нууцын зэрэглэлтэй мэдээлэл агуулсан эсэх (шаардлагатай бол ангилан ялгах, нууцлалыг хангах боломж).
Нээлттэй болгохоор сонгосон боловч шууд нийтлэх боломжгүй өгөгдлийг тодорхой төлөвлөгөөний дагуу цэвэрлэх, стандартчилах, ангилах, баримтжуулах ажлыг үе шаттайгаар хэрэгжүүлж, нээлттэй өгөгдлийн шаардлага хангасан хэлбэрт шилжүүлэн дараалсан байдлаар нийтэлж болно. Ингэснээр мэдээлэл хариуцагч байгууллага нь нөөц боломждоо тулгуурлан, бодит хэрэгцээнд нийцсэн, чанартай нээлттэй өгөгдлийг тогтвортойгоор бий болгох нөхцөл бүрдэнэ.
Дараах алхмуудаар нээлттэй өгөгдлийг сонгох боломжтой. Үүнд:
-
Эрэлт нийцлийн харьцуулалт хийх - Тооллогоор бүртгэгдсэн өгөгдлийг өгөгдлийн эрэлттэй харьцуулж тулгалт хийнэ. Тэхдээ эдгээр асуултад тулгуурлавал зохистой.
-
Иргэн, хуулийн этгээд хамгийн их сонирхож буй өгөгдөл аль нь вэ?
-
Олон нийтэд ашиг тустай юу?
-
Ил тод байдлыг нэмэгдүүлэх ач холбогдолтой юу?
-
Хуулийн болон нууцлалын шалгуур - Хууль, тогтоомж хамаарах хувь хүнийг тодорхойлох болон байгуулагын нууцад хамаарах эсэх?
-
**Бэлэн байдлын үнэлгээ хийх **- Өгөгдөлд доорх шалгуураар оноо өгч өндөр оноотойг түрүүлж нийтлэх зарчимыг баримтлах нь тохиромжтой.
-
Цахим хэлбэртэй юу?
-
Бүтэцтэй өгөгдөл үү?
-
Тогтмол шинэчлэгддэг үү?
-
Чанарын асуудал багатай юу?
-
**Нөлөөлөл, зардлын шинжилгээ хийх **- Өгөгдлийг дараах 2 шалгуураар үнэлж болно. Үүнд:
-
Нийгмийн болон эдийн засгийн нөлөөлөл
-
Боловсруулах, цэвэрлэх зардал
-
**Өгөгдлийг эрэмбэлэх **- Дээрх үнэлгээнд үндэслэн өгөгдлийн 3 ангилж эрэмбэлэх боломжтой. Үүнд:
I зэрэглэл - Нэн тэргүүнд нийтлэх
-
Өндөр эрэлттэй
-
Хууль зүйн саадгүй
-
Бэлэн байдал сайн
II зэрэглэл - Нэн тэргүүнд нийтлэх
- Эрэлттэй боловч цэвэрлэгээ шаардлагатай.
III зэрэглэл - Нэн тэргүүнд нийтлэх
-
Эрэлт бага
-
Нууцлал өндөр
-
Зардал их
**Жишээ нь: **Нээлттэй өгөгдлийн тоолллого болон эрэлтийг тодорхойлсон Аймгийн Засаг даргын Тамгын газарт цугласан өгөгдлийг дээрх шалуурын дагуу жишээ болгон үзүүлж байна.
Өгөгдлийн төрөл
Эрэлт
Нууцлал/ Хувийн мэдээлэл
Бэлэн байдал
Эрэмбэлэлт
Нийтлэх дараалал
Төсвийн гүйцэтгэл
Өндөр
Байхгүй
Сайн
I зэрэглэл
I шат- нэн тэргүүнд нийтлэх
Тендерийн мэдээлэл
Өндөр
Байхгүй
Дунд
I зэрэглэл
I шат- нэн тэргүүнд нийтлэх
ЖДҮ эрхлэгчдийн мэдээлэл
Дунд
Регистр, утас, хаяг агуулсан
Дунд
II зэрэглэл
II шат-
Хувийн мэдээллийг цэвэрлэн, кодчилж нийтлэх
Аймгийн үйлчилгээний статистик
Дунд
Байхгүй
Дунд
II зэрэглэл
II шат- бэлтгэж нийтлэх
Ажилтны үнэлгээ, дотоод үнэлгээ
Бага
Хувийн өндөр мэдээлэлтэй
Дунд
III зэрэглэл
III шат- нийтлэх боломжгүй/ зөвхөн нэгдсэн статистик
**АЛХАМ 2 НЭЭЛТТЭЙ ӨГӨГДЛИЙГ НИЙТЛЭХЭД БЭЛТГЭХ **
Мэдээлэл хариуцагч байгууллага нь нээлттэй өгөгдөл нийтлэхдээ зөвхөн өгөгдлийн файлыг байршуулж дуусгах бус, тухайн өгөгдлийг ойлгох, ашиглах, дахин боловсруулахад шаардлагатай дагалдах мэдээлэл, баримт бичгийг хамтад нь бэлтгэх шаардлагатай. Мөн нээлттэй өгөгдөлд иргэн, хуулийн этгээд, судлаач, хөгжүүлэгчид хялбар, саадгүй хандах боломжийг бүрдүүлэхэд анхаарна.
2.1 Нээлттэй өгөгдлийг бэлтгэх
Нээлттэй өгөгдлийг нийтлэхийн өмнө өгөгдлийн бүрдлийн шаардлагад нийцүүлэн бэлтгэнэ.
- Өгөгдлийг зөв хүснэгтэн бүтцэд оруулж бэлтгэх
Хүснэгтэд оруулснаар дараах давуу талыг үүсгэнэ:
- Машин унших боломжийг хангах,
- Олон төрлийн формат руу хөрвүүлэхэд хялбар байх,
- Хэрэглэгчдэд ойлгомжтой, дахин ашиглахад тохиромжтой байх үндэс болно.
Хэрэгжүүлэх шаардлага:
- Өгөгдлийг мөр–баганын логик бүтэцтэй бэлтгэх
Нэг мөр = Нэг бүртгэл
Нэг багана = Нэг утга
Мөр бүр нэг л объект, нэгж, үйл явдлыг илэрхийлнэ.
Багана бүр тодорхой нэг утгыг илэрхийлнэ.
Нэг мөрөнд олон бүртгэл оруулахгүй байх;
Холимог мэдээлэл (огноо+тайлбар г.м) нэг баганад байхгүй.
**Буруу жишээ: **
Салбар: Хүнс, Барилга, Үйлчилгээ (Нэг нүдэнд олон утга)
**Буруу жишээ: **
2023.05.01-батлагдсан
Зөв жишээ: Тус бүрийг тусдаа мөр болгон задлах
Зөв жишээ:
-
Decision_date: 2023-05-01
-
Decision_status: Батлагдсан
-
Хоосон мөр, нийлмэл нүдгүй байх
-
“Merge” хийсэн нүдгүй байх
-
Гарчиг нь 1 мөрөнд
-
Хоосон мөр оруулахгүй
-
Давхардсан өгөгдөлгүй байх
-
Нэг бүртгэл давтагдахгүй
-
Давтагдлыг шалгах
-
Гарчиг тодорхой, стандарт нэршилтэй байх
-
Баганын нэр, товч, ойлгомжтой, давхардалгүй байх
-
Журмын 2.1.5, 2.1.9 заалтуудыг оруулах
-
Хоосон зай, тусгай тэмдэгтээс зайлсхийх
-
Нэгдсэн формат ашиглах
-
**Огноо: **YYYY-MM-DD
-
**Тоо: **мянгатын зайгүй, текст биш, цэвэр тоон утга
-
**Код: **нэг стандарт ангилал ашиглах 2.1.5.мэдээллийн сангийн нэгдсэн ангилал, код ашигласан байх;
-
Кодчилол, ангилал тодорхой байх
-
Код албан ёсны ангиллаар
-
Нэршил тогтмол байх
-
Машин унших форматад хадгалах
-
CSV (UTF-8 encoding)
-
XLSX (гэхдээ merge, форматын алдаагүй байх)
-
JSON
**Жишээ нь: **Аймгийн Засаг даргын Тамгын газраас буруу бүтэцтэй Тендерийн өгөгдлийг хэрхэн зөв болгосон нь
Буруу бүтэцтэй хүснэгт:
Тендер
Байршил
Он
Үнийн дүн
Сургуулийн засвар-Хархорин, Бат-Өлзий
2023
1,500,000₮
Үүнд үүсч буй асуудал:
- Нэг нүдэнд 2 сум бичсэн
- Валютын тэмдэгтэй, текст хэлбэрийн тоо
- “Тендер” баганад нийлмэл мэдээлэл
- Код байхгүй
- Стандарт огноо форматгүй
Зөв бүтэцтэй хүснэгт:
tender_id
tender_id
soum_code
year
amount_mnt
TND-2023-001
Сургуулийн засвар
43101
2023
1500000
TND-2023-002
Эмнэлгийн тоног төхөөрөмж
43102
2023
8200000
Зөв хүснэгтэн бүтэцтэй болгосноор:
-
Нийлмэл мэдээллийг салгасан (Нийлмэл мэдээллийг салгасан гэдэг нь )
-
Стандарт багана үүссэн
-
Кодчилол ашигласан (Журмын 2.1.5 )
-
Форматыг нэг мөр болгосон
-
Машин уншигдах хэлбэрт шилжүүлсэн
- Өгөгдлийг цэвэрлэх, үнэн зөв, бүрэн гүйцэд эсэхийг шалгах
Нээлттэй нийтлэхээс өмнө өгөгдлийн чанарыг заавал нягтална.
Шалгах үзүүлэлтүүд:
- Давхардсан мөр байгаа эсэх;
- Форматын алдаа;
- Дутуу утга;
- Логикийн зөрчил;
- Эх сурвалж баталгаажсан эсэх;
- Тооцоолол, нэгж, ангилал хоорондын нийцтэй байдал.
Оновчгүй өгөгдөл
id
Нэр
Төрсөн огноо
Бүртгэсэн огноо
Орлого
Аймаг
Хүн ам
Эх сурвалж
1
Бат
2026/01/01
2025-01-05
1,500,000₮
УБ
1.5
1
Бат
2026/01/01
2025-01-05
1500000
УБ
1.5 сая
2
Саруул
2000-05-10
1999-01-01
2000000
Дархан
120000
Судалгаа
Илэрч буй алдаа:
-
Давхардсан мөр – ID=1 хоёр удаа давтагдсан.
-
Форматын алдаа – Огноо (2026/01/01 ба 2000-05-10) жигд биш
-
Орлого (₮ тэмдэг, таслал, текст холилдсон)
-
Дутуу утга – Эх сурвалж хоосон
-
Логикийн зөрчил – Төрсөн огноо (2026) ирээдүйн огноо
-
Бүртгэсэн огноо төрсөн огнооноос өмнө (1999 < 2000)
-
Эх сурвалж тодорхойгүй – “Судалгаа” гэж ерөнхий бичсэн
-
Нэгжийн зөрүү – Хүн ам: “1.5”, “1.5 сая”, “120000” холилдсон
Оновчтой өгөгдөл (Цэвэрлэсэн өгөгдөл)
id
Нэр
Төрсөн огноо
Бүртгэсэн огноо
Орлого (төгрөг)
Аймаг
Хүн ам (хүн)
Эх сурвалж
Шинэчилсэн огноо
1
Бат
2000-01-01
2025-01-05
1500000
УБ
1500000
Албан статистик тайлан 2025
2026-02-15
2
Саруул
2000-05-10
2025-01-10
2000000
Дархан
120000
Албан статистик тайлан 2025
2026-02-15
- Өгөгдлийн бүрдэл нь нарийвчилсан, анхдагч өгөгдөл эсэхийг нягтлах
Боломжтой бол өгөгдлийг нэгтгэсэн дүн биш, хамгийн анхдагч, нарийвчилсан түвшинд нийтлэх нь зүйтэй.
Жишээлбэл:
- Хүйс, насны бүлэг,
- Байршлын нарийвчилсан түвшин (аймаг, сум, хороо),
- Хугацааны нарийвчлал (жил, улирал, сар гэх мэт). Ингэснээр хэрэглэгч илүү нарийн дүн шинжилгээ хийх боломжтой болно.
Он
Сар
Аймаг
Сум
Хүйс
Насны бүлэг
Хүн ам
2025
01
УБ
Баянзүрх
Эр
0–4
12000
2025
01
УБ
Баянзүрх
Эм
0–4
11500
2025
01
Дархан
Дархан сум
Эр
0–4
2300
- Хүн, хуулийн этгээдийг тодорхойлох боломжтой болон төр, байгууллагын нууцтай хамаарал бүхий мэдээлэл байгаа эсэхийг нягтлах
Үүнд:
- Хувийн мэдээлэл,
- Төрийн болон албаны нууц,
- Оюуны өмчийн хязгаарлалт агуулагдсан эсэхийг урьдчилан шалгана.
Оновчгүй өгөгдөл:
Нэр
Регистр
Утас
Өвчний мэдээлэл
Аймаг
Бат
АБ12345678
99112233
Чихрийн шижин
УБ
Саруул
АВ98765432
99113344
Даралт ихсэх
Дархан
Дээрх оновчгүй өгөгдлийн алдаа нь
- Регистрийн дугаар, Утас, Эрүүл мэндийн мэдээлэл зэрэг нь хувь хүнийг шууд таних боломжтой тул нээлттэй өгөгдөлд нийтлэх боломжгүй.
Оновчтой өгөгдөл:
Аймаг
Насны бүлэг
Хүйс
Өвчний төрөл
Тоо
УБ
30–39
Эр
Чихрийн шижин
120
Дархан
40–49
Эм
Даралт
85
- Нэргүйжүүлэх
Хэрэв өгөгдөлд хувийн мэдээлэл агуулагдсан боловч бодлогын болон судалгааны ач холбогдол өндөр бол нэргүйжүүлэх (anonymization) аргачлал ашиглан хувь хүнийг таних боломжгүй болгоно.
Оновчгүй өгөгдөл:
Нэр
Нас
Хаяг
Орлого
Бат
34
Баянзүрх 5-р хороо
2,000,000
Саруул
29
Сүхбаатар 3-р хороо
1,800,000
Дээрх оновчгүй өгөгдлөөс нэр, хаягаар тухайн хүнийг тодорхойлох боломжтой.
Оновчтой өгөгдөл:
ID
Насны бүлэг
Дүүрэг
Орлогын бүлэг
001
30–39
Баянзүрх
1.5–2.0 сая
002
20–29
Сүхбаатар
1.5–2.0 сая
2.2 Нээлттэй өгөгдлийн дагалдах баримт бичгүүдийг бэлтгэх
Нээлттэй өгөгдлийг чанартай, ойлгомжтой, хэрэглэхэд хялбар болгохын тулд холбогдох мэдээллийг агуулсан доорх дагалдах баримт бичгүүдийг хамт нийтлэх нь хэрэглэгч тухайн нээлттэй өгөгдлийн талаар бүрэн ойлголттой болж, хэрхэн боловсруулж ямар үр дүнд хүрэхээ шийдэх боломжийг олгодог. Үүнд:
- Өгөгдлийн танилцуулга
- Өгөгдлийн толь
- Мета өгөгдөл
- Бусад нэмэлт баримт бичгүүд
Эдгээрийг тусдаа файл, эсвэл мета өгөгдлийн хэсэгт нэгтгэн байршуулах боломжтой.
Өгөгдлийн танилцуулга гэж юу вэ?
Тухайн нээлттэй өгөгдөл юуны тухай, ямар зорилготой, хэрхэн ашиглах боломжтой, ямар бүтэцтэй болохыг тайлбарласан баримт бичиг юм. Энэ нь хэрэглэгчдэд өгөгдлийг хурдан ойлгох, зөв ашиглах, хязгаарлалтыг мэдэх, дахин ашиглах боломжийг тодорхой харах зорилготой.
Яагаад хэрэгтэй вэ?
Хэрэв зөвхөн CSV файл байвал багана юуг илэрхийлж байгааг ойлгоход төвөгтэй, кодчилол тайлбаргүй бол ашиглахад хэцүү, шинэчлэлтийн хугацаа тодорхойгүй байж болно. Иймээс өгөгдлийн танилцуулгыг “Өгөгдлийг тайлбарласан баримт бичиг” гэж ойлгож болно.
**Товчоор бол **өгөгдлийн танилцуулга нь өгөгдлийн зорилго, хэрэглээ, бүтцийг тайлбарладаг.
Өгөгдлийн танилцуулга нь дараах үндсэн агуулгын хүрээнд байж болохыг жишээ авч тайлбарлая.
Агуулга
Жишээ: Аймгийн ЗДТГ-Төсвийн гүйцэтгэл
Өгөгдлийн нэр
Аймгийн 2023 оны төсвийн гүйцэтгэл
Зорилго
Аймгийн төсвийн орлого, зарлагын мэдээллийг олон нийтэд ил тод болгох.
Товч тайлбар
Энэхүү өгөгдөл нь батлагдсан төсөв болон гүйцэтгэлийн дүнг багц, хөтөлбөр, арга хэмжээний түвшинд агуулна.
Хамрах хүрээ (орон зай, хугацаа)
Хамрах хугацаа: 2023 он
Хамрах нутаг дэвсгэр: Аймгийн хэмжээнд
Бүтэц (ерөнхий тайлбар)
Өгөгдөл нь 15 баганаас бүрдэх бөгөөд байгууллагын код, зардлын төрөл, батлагдсан төсөв, гүйцэтгэл зэрэг талбаруудыг агуулна.
Шинэчлэлтийн давтамж
Жилд нэг удаа
Эх сурвалж
Санхүүгийн тайлангийн нэгдсэн систем
Хязгаарлалт
Зарим гүйцэтгэлийн мэдээлэл баталгаажих шатандаа байж болно.
Лиценз
CC BY 4.0
Холбоо барих мэдээлэл
Өгөгдлийн толь гэж юу вэ?
Тухайн өгөгдлийн багцад (dataset) орсон багана (талбар) бүрийн утга, бүтэц, формат, кодчилол, тайлбарыг нарийвчлан тодорхойлсон баримт бичиг юм.
Яагаад хэрэгтэй вэ?
Хэрэв өгөгдлийн толь байхгүй бол багана юуг илэрхийлж байгааг ойлгоход төвөгтэй, кодчилол тайлбаргүй байх, огноо, мөнгөн дүнгийн формат ойлгомжгүй байх, дахин ашиглахад хүндрэл үүсч болно. Харин өгөгдлийн толийг ашигласнаар хүснэгтийн талбар бүрийг тодорхойлж ойлгомжтой болох, кодчилол, форматыг тайлбарлан алдаа багасах, стандартжуулснаар стандартыг мөрдөж хэвших, дахин ашиглах боломжийг нэмэгдүүлдэг. Иймээс өгөгдлийн толийг “Хүснэгтийн тайлбарлах гарын авлага” гэж ойлгож болно.
**Товчоор бол **өгөгдлийн толь нь багана бүрийн утгыг тайлбарладаг.
Өгөгдлийн толинд ихэвчлэн дараах мэдээллийг оруулсан байдаг. Үүнд:
- Талбарын нэр
- Тайлбар
- Өгөгдлийн төрөл – текст, тоо, огноо гэх мэт
- Формат – YYYY-MM-DD, ₮, 5 оронтой код гэх мэт
- Боломжит утга, кодын тайлбар
- Жишээ утга
Жишээ нь: Аймгийн ЗДТГ-Тендерийн мэдээлэл
Багана
Тайлбар
Төрөл
Формат
Боломжит утга
Жишээ
tender_id
Тендерийн дугаар
Text
TND-YYYY-ХХХ
Давтагдашгүй
TND-2023-001
tender_type
Тендерийн төрөл
Number
1-3
1=Нээлттэй2=Хязгаарлагдмал
3=Нууц
1
publish_date
Зарласан огноо
Date
YYYY-MM-DD
2023-05-10
amount_date
Үнийн дүн
Number
Цэвэр тоо
0-с дээш
15000000
Мета өгөгдөл гэж юу вэ?
“Өгөгдлийн тухай өгөгдөл” юм. Өөрөөр хэлбэл, тухайн өгөгдлийн багц юуны тухай, хэн гаргасан, хэзээ шинэчилсэн, ямар нөхцөлтэй ашиглах зэргийг тайлбарладаг.
Яагаад хэрэгтэй вэ?
Мета өгөгдөлгүй бол өгөгдлийг хэн гаргасныг мэдэхгүй, шинэчлэгдсэн эсэх нь тодорхойгүй, ашиглах нөхцөл (лиценз) ойлгомжгүй, хугацаа, хамрах хүрээ тодорхойгүй байдал үүсдэг. Харин мета өгөгдөл нь нээлттэй өгөгдөлд тавигдах зайлшгүй шаардлага бөгөөд ил тод байдлыг хангах, итгэлцлийг нэмэгдүүлэх, хайлт ангилалд ашиглагдах ба дахин ашиглах боломжийг бүрдүүлдэг “өгөгдлийн багцын баримт бичиг” гэж ойлгож болно.
Товчоор бол мета өгөгдөл нь өгөгдлийн багцын ерөнхий мэдээллийг тайлбарладаг.
Мета өгөгдөл нь дараах үндсэн мэдээллийг багтаах боломжтой бөгөөд жишээ авч тайлбарлая.
Мета өгөгдөлд багтах үндсэн мэдээлэл
Жишээ: Аймгийн ЗДТГ-Төсвийн мэдээлэл
Өгөгдлийн нэр
Аймгийн 2023 оны төсвийн гүйцэтгэл
Товч тайлбар
Аймгийн төсвийн батлагдсан болон гүйцэтгэсэн зардлын мэдээлэл
Хариуцагч байгууллага
Аймгийн Засаг даргын Тамгын газар
Эх сурвалж
Хамрах хүрээ
2023 он
Газар зүйн хамрах хүрээ
Аймаг
Шинэчлэлтийн давтамж
Жилд 1 удаа
Формат (CSV, XLSX, API гэх мэт)
CSV
Лиценз
CC BY 4.0
Холбоо барих мэдээлэл
Анх нийтэлсэн огноо
Сүүлд шинэчилсэн огноо
2024-01-15
Чанаргүй мета өгөгдөл нь өгөгдлийг буруу ойлгох, буруу ашиглах эрсдэл дагуулдаг тул өндөр ач холбогдолтой.
2.3 Нээлттэй өгөгдлийн олон талт хандах боломжийг нээх
Нээлттэй өгөгдлийн олон талт хандах боломж гэдэг нь хэн ч, ямар ч программ ашиглаж байсан, ямар ч техникийн түвшинд байсан өгөгдлийг татаж, боловсруулах, дахин ашиглах боломжтой байхыг хэлнэ.
Энэ нь дараах бүрэлдэхүүн хэсгүүдээс бүрдэнэ:
- Машин унших боломжтой формат
Жишээ нээлттэй форматууд
Өгөгдлийн төрөл
Жишээ нээлттэй форматууд
Тайлбар
Хүснэгтэн өгөгдөл
CSV, JSON, XML, ODF, RDF, TSV
Өгөгдлийг хүснэгтэн хэлбэрээр хадгалах, олон программд шууд унших боломжтой
Орон зайн өгөгдөл
GeoJSON, GML, KML, WKT, LAS, IFC, Shapefile
Газрын байрлал, газрын зурагтай холбоотой өгөгдөл
Домайн / онцлог өгөгдөл
PX, JSON-stat, NetCDF, BUFR
Статистик, цаг уур, шинжлэх ухааны өгөгдөл зэрэг онцлогтой мэдээлэл
Формат хооронд хөрвүүлэх аргачлал
- MS Excel файл (.xlsx) → CSV файл
CSV (Comma Separated Values) нь хамгийн түгээмэл нээлттэй формат бөгөөд хүснэгтэн өгөгдлийг компьютерийн олон программ унших боломжтой болгодог.
Алхам 1: Excel файлыг нээх
- Microsoft Excel программыг нээнэ.
- Хөрвүүлэх шаардлагатай .xlsx файлыг нээнэ.
- Хэрэв олон sheet байгаа бол зөв sheet ийг идэвхжүүлсэн эсэхийг шалгана.
Алхам 2: Хадгалах (Save As) сонголт
- Дээд цэснээс File - Save As (эсвэл Файл - Хадгалах) руу орно.
- Файл хадгалах folder-ээ сонгоно.
Алхам 3: Файл төрлийг сонгох
- Save as type (эсвэл Файлын төрөл) цэсийг нээнэ.
- Жагсаалтаас CSV (Comma delimited (*.csv) сонголтыг сонгоно.
Алхам 4: Файл нэр өгөх
- Файлд хүссэн нэр өгнө, жишээ: mydata.csv
- Save товчийг дарна.
Анхаарлах: Excel alert гарч болох ба “Selected file type does not support multiple sheets” гэх мэт сануулга өгч болно. Энэ нь зөвхөн одоо идэвхжүүлсэн sheet хадгалагдана гэсэн утгатай.
Алхам 5: Бэлэн CSV файлыг шалгах
- Notepad, VS Code, Sublime Text гэх мэт текст засварлагч програм ашиглан нээнэ.
- Мэдээлэл таслалтаар (,) тусгаарлагдсан байгаа эсэхийг шалгана.
CSV файлыг Python, R, Excel, Google Sheets зэрэг програмд шууд уншиж ашиглаж болно.
- **CSV файлыг JSON формат руу хөрвүүлэх заавар **
JSON (JavaScript Object Notation) нь өгөгдлийг бүтэцтэй хэлбэрээр хадгалах, API болон вэб системүүдэд ашиглахад тохиромжтой формат юм.
Арга 1: Онлайн хөрвүүлэгч ашиглах
- CSV файлаа бэлдэнэ.
- Google дээр “CSV to JSON converter” гэж хайна.
- Аль нэг хөрвүүлэгч сайт руу орно. (жишээ: csvjson.com)
- CSV файлаа\ оруулна (upload хийх эсвэл\ copy–paste хийнэ).
- Convert товч дарна.
- Гаралт гарч ирнэ - JSON файлыг татаж авна.
Давуу тал: Програмчлал мэдэхгүй хэрэглэгчдэд тохиромжтой. Арга 2: Python ашиглах
- Python суулгах
- Python скрипт бичих
Жишээ Python код:
import csv
import json