MENGELOLA DATA RESOURCES
1. Managemen Basis Data
Pentingnya data : bagi perusahaan untuk keunggulan kompetitif
Sebuah aktifitas manajerial yg mengimplementasikan teknologi informasi seperti manajemen database, gudang data dalam tugasnya untuk mengelola sumber data organisasi untuk memenuhi pihak yg berkepentingan.
Proses ini biasanya menggunakan (input-proses-output) untuk mengakses dan mengekstrak data yg releven serta mengubahnya kedalam bentuk umum.
Misalnya : beberapa anak perusahaan mencatat aktifitas menggunakan definisi data yg berbeda sehingga hasil data kurang optimal.
Pemecahan : membuat kesepakatan mengenai definisi data untuk semua kegiatan bisnis
A. DATA :
• Karakter : adalah suatu huruf, angka, symbol dsb.
• Field : sekelompok karakter yg terhubung contoh : nama
Field mewakili atribut (karakter/kualitas) dari entitas (objek, orang dsb)
Contoh : database PLN
• Entitas : pelanggan, meteran, tagihan, pembayaran, penggunaan materan
• Hubungannya : tagihan dikirim ke pelanggan dan pelanggan bayar
Catatan : field data yg saling terhubung dan dikelompokkan sehingga catatan dapat mewakili atribut
Contoh : catatan penggajian meliputi nama orang, upah, jaminan social dsb
B. File : catatan yg terhubung
Contoh : penggajian : master karyawan vs transaksi
C. Database : kumpulan terintegrasi dari elemen data yg secara logic saling terhubung
Jenis Database :
• Database Operasional : berisi data operasi perusahaan berupa transaksi, produksi dsb
• Database terdistribusi : data yg terdapat dalam server jaringan dapat berupa copy dari database operasional
• Database eksternal : dalam dunia maya
Contoh : database Produksi, database SDM
Data warehousing
Penggudangan data (data warehousing) adalah sebuah penampungan data secara elektronik dari sebuah organisasi. Gudang data (data warehouse) dirancang untuk memudahkan pelaporan dan analisa data.
Penggudangan data yang berfokus pada penyimpanan data. Namun, cara untuk mengambil dan menganalisis data, mengekstrak, mengubah dan mengambil data, dan untuk mengelola kamus data juga dianggap komponen penting dari sistem pengudangan data. Banyak referensi dalam pergudangan data ini menggunakan konteks yang lebih luas. Oleh karena itu, definisi yang diperluas untuk data pergudangan meliputi bussiness intelegence tools, alat-alat untuk mengambil, mengubah, dan memuat data ke dalam penampungan, dan alat-alat untuk mengelola dan mengambil metadata.
Manfaat Penggudangan data antara lain
• penggudangan data memberikan model data umum untuk semua kepentingan tanpa memperdulikan dari mana sumber datanya. Hal ini mempermudah untuk membuat laporan dan menganalisis informasi dibandingkan dengan model data yang beragam seperti faktur penjualan, kuitansi penerimaan barang, buku besar, dll
• Sebelum memuat data ke dalam gudang data, segala bentuk inkonsistensi diidentifikasi dan diselesaikan. Ini sangat mempermudah pelaporan dan analisis.
• Informasi dalam penggudangan data yang berada di bawah kontrol penggudang data, sehingga meskipun sistem sumber data berubah seiring waktu, informasi dalam gudang tetap dapat disimpan dengan aman selamanya. Karena terpisah dari sistem operasional, gudang data menyediakan media data tanpa memperlambat sistem operasional.
• Gudang data dapat bekerja bersama-sama karena itu dapat meningkatkan nilai aplikasi operasional bisnis, terutama sistem manajemen hubungan pelanggan.
• Penggudangan data dapat memfasilitasi sistem pendukung keputusan aplikasi seperti laporan kecenderungan (misalnya, dengan barang yang paling bagus penjualannya di wilayah tertentu dalam waktu dua tahun terakhir), melaporkan penyelewengan, dan laporan yang perbandingan antara kinerja sebenarnya dengan tujuan yang telah ditetapkan.
Data Mining ( Penggalian Data )
Data mining adalah proses penggalian pola tersembunyi dari data. Semakin banyak data dikumpulkan, dengan jumlah data yang dua kali lipat setiap tiga tahun, data yang menjadi semakin penting untuk mentransformasikan data menjadi informasi. Hal ini umumnya digunakan dalam berbagai praktek pencarian keterkaitan data, seperti pemasaran, mendeteksi penyelewengan dan penemuan ilmiah. Data Mining dapat diterapkan pada set data berukuran apapun. Namun, meskipun dapat digunakan untuk menemukan pola-pola tersembunyi di dalam data yang telah dikumpulkan, ia tidak dapat menemukan pola yang tidak ada dalam data, ataupun dalam data yang belum dikumpulkan. Selama berabad-abad, manusia telah menggali informasi secara manual dari data yang ada, tetapi semakin meningkatnya volume data dalam era modern telah memunculkan ide untuk penggalian informasi secara otomatis.
Sebuah sistem manajemen basisdata relasional atau dalam bahasa Inggrisnya dikenal sebagai relational database management system (RDBMS) adalah sebuah program komputer (atau secara lebih tipikal adalah seperangkat program komputer) yang didisain untuk mengatur/memanajemen sebuah basisdata sebagai sekumpulan data yang disimpan secara terstruktur, dan melakukan operasi-operasi atas data atas permintaan penggunanya. Contoh penggunaan DBMS ada banyak sekali dan dalam berbagai bidang kerja, misalnya akuntansi, manajemen sumber daya manusia, dan lain sebagainya. Meskipun pada awalnya DBMS hanya dimiliki oleh perusahaan-perusahaan berskala besar yang memiliki perangkat komputer yang sesuai dengan spesifikasi standar yang dibutuhkan (pada saat itu standar yang diminta dapat dikatakan sangat tinggi) untuk mendukung jumlah data yang besar, saat ini implementasinya sudah sangat banyak dan adaptatif dengan kebutuhan spesifikasi data yang rasional sehinggal dapat dimiliki dan diimplementasikan oleh segala kalangan sebagai bagian dari investasi .
Basis data
Basis data (bahasa Inggris: database), atau sering pula dieja basisdata, adalah kumpulan informasi yang disimpan di dalam komputer secara sistematik sehingga dapat diperiksa menggunakan suatu program komputer untuk memperoleh informasi dari basis data tersebut. Perangkat lunak yang digunakan untuk mengelola dan memanggil kueri (query) basis data disebut sistem manajemen basis data (database management system, DBMS). Sistem basis data dipelajari dalam ilmu informasi.
Istilah "basis data" berawal dari ilmu komputer. Meskipun kemudian artinya semakin luas, memasukkan hal-hal di luar bidang elektronika, artikel ini mengenai basis data komputer. Catatan yang mirip dengan basis data sebenarnya sudah ada sebelum revolusi industri yaitu dalam bentuk buku besar, kuitansi dan kumpulan data yang berhubungan dengan bisnis.
Konsep dasar dari basis data adalah kumpulan dari catatan-catatan, atau potongan dari pengetahuan. Sebuah basis data memiliki penjelasan terstruktur dari jenis fakta yang tersimpan di dalamnya: penjelasan ini disebut skema. Skema menggambarkan obyek yang diwakili suatu basis data, dan hubungan di antara obyek tersebut. Ada banyak cara untuk mengorganisasi skema, atau memodelkan struktur basis data: ini dikenal sebagai model basis data atau model data. Model yang umum digunakan sekarang adalah model relasional, yang menurut istilah layman mewakili semua informasi dalam bentuk tabel-tabel yang saling berhubungan dimana setiap tabel terdiri dari baris dan kolom (definisi yang sebenarnya menggunakan terminologi matematika). Dalam model ini, hubungan antar tabel diwakili denga menggunakan nilai yang sama antar tabel. Model yang lain seperti model hierarkis dan model jaringan menggunakan cara yang lebih eksplisit untuk mewakili hubungan antar tabel.
Istilah basis data mengacu pada koleksi dari data-data yang saling berhubungan, dan perangkat lunaknya seharusnya mengacu sebagai sistem manajemen basis data (database management system/DBMS). Jika konteksnya sudah jelas, banyak administrator dan programer menggunakan istilah basis data untuk kedua arti tersebut.
Sejarah atas istilah RDBMS
Edgar F. Codd memperkenalkan istilah ini pada makalah seminarnya yang berjudul "A Relational Model of Data for Large Shared Data Banks". Salah satu definisi yang cukup dikenal secara luas atas sebuah sistem basisdata relasional adalah 12 hukum Codd. Namun demikian, pada awal-awal implementasinya banyak model relasional yang tidak mengikuti seluruh elemen-elemen yang terdapat dalam hukum-hukum Codd tersebut yang menjadikan terminologinya berkembang untuk mendeskripsikan sebuah tipikal sistem basisdata yang lebih luas. Dalam cakupan yang minimum sistem tersebut memenuhi kriteria berikut:
• menyajikan data pada pengguna dalam bentuk relasional (ditampilkan dalam bentuk tabular, sebagai koleksi dari tabel dimana setiap tabel beriisi sekumpulan baris dan kolom)
• menyediakan operator relasioanl untuk memanipulasi data dalam bentuk tabular
Sistem yang pertama kalinya yang secara relatif memenuhi implementasi atas sebuah model relasional adalah Pusat Studi Ilmiah IB, Inggris, di Peterlee; IS1 (1970-1972) dan implementasi lain yang mengikutinya PRTV (1973-1979). Sistem yang pertama kalinya dijual secara komersil sebagai RDBMS adalah Multics Relational Data Srore pada tahun 1978. Yang lainnya adalah Berkeley Ingres QUEL dan IBM BS12.
Pemanfaatan saat ini
Ada beberapa ketidaksepahaman terhadap definisi atas "relasional" dari DBMS.
Definisi yang paling populer dari sebuah RDBMS seringkali dianggap kurang tepat; beberapa kalangan berargumentasi bahwa penyajian data sebagai kumpulan baris dan kolom sudah cukup memenuhi syarat untuk dikatakan sebagai sebuah RDBMS. Tipikalnya, sebuah sistem basisdata dikatakan memenuhi kriteria sebagai RDBMS apabila memenuhi hukum-hukum yang ditetapkan dalam 12 hukum Codd, namun pada kenyataannya justru kebanyakan sistem basisdata tidak mendukung sepenuhnya implementasi hukum-hukum Codd tersebut.
Kalangan lainnya beranggapan apabila sebuah sistem basisdata tidak mengimplementasikan keseluruhan hukum-hukum Codd tersebut, maka sistem tersebut tidak dapat disebut sebagai relasional. Pandangan seperti ini, yang banyak diterima oleh para teoritis dan kalangan-kalangan lainnya yang memegang teguh prinsip-prinsip Codd, tentunya akan mendiskualifikasikan banyak sistem basisdata yang ada saat ini "tidak murni relasional". Dalam kenyataannya, sistem basisdata yang menggunakan SQL (Structured Query Language) untuk mengakses dan memodifikasi data tidak bisa dikatakan sebagai RDBMS menurut definisi ini. Sementara itu, para pendukung atas sistem basisdata yang ada menyebutkan sebuah sistem basisdata yang menerapkan hanya beberapa dari hukum-hukum Codd tersebut disebut sebagai Sistem Manajemen Basisdata Semi-Relasional/Pseudo-Relational Database Management Systems (PRDBMS). Untuk sistem manajemen basis data yang sepenuhnya menerapkan hukum-hukum Codd tersebut selanjutnya disebut sebagai Sistem Manajemen Basisdata Murni-Relasional/Trully-Relational Database Management Systems (TRDBMS).
Saat ini, hampir seluruh RDBMS yang ada menerapkan SQL sebagai bahasa query namun juga menyediakan dan mengimplementasi beberapa alternatif lainnya. Alpora Dataphor adalah RDBMS yang tersedia secara komersil yang mengikuti secara penuh ke dua belas hukum-hukum Codd tersebut, dan kedua kelompok mengenalnya sebagai RDBMS.
Variasi dinamis
Keluhan yang muncul dan dikenal secara umum terhadap keberadaan RDBMS adalah kenyataan bahwa implementasi yang ada saat ini dipandang sebagai terlalu "statis". Spekulasipun bermunculan terhadap kemungkinan untuk membuat sebuah sistem basisdata generasi baru yang menggunakan model "relasional secara dinamis" dengan kolom yang bisa dibuat secara dinamis, ukuran yang berkembang secara dinamis, didefinisikan secara dinamis. Setiap baris dapat diimplementasikan sebagai map (kamus ataupun larik asosiatif) dan kolom-kolom yang tidak dikenal secara sederhana disajikan sebagai field kosong. Beberapa kalangan menganggap hal ini menyalahi model relasioal murni, namun kalangan lain menyanggah bahwa sebuah penggunaan map hanyalah sebagai detil implementasi saja. Sehingga dalam pandangan ini, sebuah "kolom yang tidak ditemukan/tidak ada" secara sederhana hanyalah dipandang sebagai perihal interpretasi dan dianggap sebagai pilihan cara penyajian saja.