Pemrosesan File dan Konsep Manajemen Data
Tinjauan Sekilas Tentang Teknologi
Pemrosesan File dan Konsep Manajemen Data
Sebuah file merupakan sekumpulan informasi yang tersimpan sedemikian rupa, hingga informasi yang dibutuhkan dapat diperoleh kembali apabila dibutuhkan atau untuk penggunaan selanjutnya.
Digolongkan menurut teknik penyimpanannya, file dapat berupa file manual dan file komputer. File manual menyimpan informasi yang dapat diperoleh kembali, dibaca dan digunakan oleh manusia. Sedangkan file komputer menyimpan informasi yang tidak dapat diperoleh kembali oleh manusia tanpa bantuan pemrosesan komputer.
File manual sebagian besar menggunakan filing cabinet sebagai sarana penyimpanan. Namun apapun bentuk sarana penyimpanannya, file manual menggunakan metode yang sama untuk menyusun rekaman yang ada di dalamnya.
File komputer menggunakan penyimpan magnetik seperti disket, CD atau harddisk sebagai sarana penyimpanan.
Menurut jenisnya file komputer terbagi menjadi :
- File Master
- File Transaksi
- File Cadangan (backup)
- File Arsip
- File Kasar (Scratch File)
Sistem akuntansi yang memakai komputer secara rutin menggunakan prosedur tertentu saat memproses file komputer. Operasi yang lazim pada file komputer yaitu memperbarui (update), memelihara, mengurutkan (sortir) dan menggabungkan (merge).
Untuk mengelola data digunakan suatu sistem perangkat lunak yang disebut Sistem Manajemen Database (SMD) yang merupakan seperangkat program komputer yang mengendalikan akses kepada database yang dilakukan oleh pengguna dan program aplikasi. Sistem ini memisahkan cara data secara fisik disimpan pada sarana penyimpan sekunder. SMD tidak hanya mengelola data itu sendiri tetapi juga hubungan antar data. Setiap apliksi perangkat lunak SMD mengasumsikan suatu model struktural untuk data. Model struktural yang lazim adalah struktur pohon, jaringan, dan relasional.
Evaluasi Teknologi Database
Teknologi database berkembang sejalan dengan perkembangan perangkat keras dan perangkat lunak. Pembuatan jaringan dan teknologi komunikasi mengubah skala ekonomi pembuatan database.
Periode
Kejadian Teknik database yang berkaitan
1960-an
Lingkungan mainframe
Sistem manajemen database
Layanan informasi on-line Sistem file
Manajemen database
Manajemen teks
1970-an
Expert systems
Pemrograman berorientasi- obyek
Inferensi dan deduksi
Inheritensi dan abstraksi
1980-an Sistem hiperteks Asosiasi
1990-an Sistem database intelijen Kombinasi teknik- teknik
Pengembangan dalam teknologi untuk melakukan masukan data ke komputer secara umum berperan dalam perkembangan database secara pesat.
A. Lingkungan Mainframe
Pada mulanya, masalah utama berkaitan dengan jumlah file yang besar.
B. Sistem Manajemen Database
Lama- kelamaan, perusahaan menghadapi masalah sistem file sederhana. Kesulitan utama termasuk menemukan file yang tepat untuk informasi yang dibutuhkan, pemborosan karena duplikasi data yang sama dalam file yang berbeda, dan kurangnya standarisasi antar file.
C. Layanan Informasi On-line
Salah satu layanan database tersambung (on-line) terbesar adalah Dialog, yang sekarang mencakup ratusan database dan ratusan jutaan catatan. Banyak perusahaan mengumpulkan informasi dari layanan on-line yang harus dikaitkan secara sistematis dengan sistem informasi mereka. Ini berhubungan juga dengan kebutuhan baru, manajemen teks, yang bersama- sama dengan data grafis dan suara, membutuhkan teknologi yang lebih baik dari yang disediakan sistem database yang tradisional. Sistem multimedia tersebut semakin penting saja masalah ini.
D. Expert Systems
Sistem ahli (expert systems) membantu pengambilan keputusan tingkat tinggi dan telah sukses diterapkan dalam beberapa area seperti pengesahaan pemberian pinjaman, penentuan dimana penggalian mineral dilakukan, dan diagnosa pengobatan.
E. Pemrograman Berorientasi-Objek
Pemrograman Berorientasi- Objek meliputi pendefinisian obyek- obyek dari daftar atau kumpulan informasi yang rumit.
F. Sistem Hiperteks
Sistem hiperteks memungkinkan para pemakai untuk mengambil database dengan cara random melalui pemilihan kata- kata kunci. Aplikasi awal hipermedia dalam bisnis sangat berkaitan dengan materi- materi referensi seperti manual kebijakan dan pelatihan.
G. Sistem Database Intelejen
Sistem database intelejen merefleksikan kecenderungan penggabungan seluruh teknologi- teknologi terbaru, termasuk yang paling muktahir, ke dalam satu sistem database.
Sistem Manajemen Database (SMD) dan Arsitekturnya
Terdapat tiga tingkatan arsitektur yang relevan dengan database dan manajemen database; arsitektur tingkat konseptual, arsitektur tingkat logis, dan arsitektur tingkat fisik. Pada tingkat konseptual, database merupakan kumpulan beragam elemen informasi yang akan digunakan untuk tujuan- tujuan yang telah dipilih. Catatan dan field- field dalam database distrukturkan dan diorganisasikan dalam beberapa pola logis, sehingga membantu pembentukan struktur data logis. Terdapat tiga jenis struktur data logis yang dapat digunakan untuk mencapai tujuan tersebut, yaitu : hirarkis, jaringan, dan relasional.
A. Arsitektur Konseptual
Model data hubungan entitas- entity relationship (ER) merupakan pendeketan yang populer. Model ER menggambarkan hubungan antar segmen secara sederhana. Terdapat pula metode- metode konseptual lainnya, termasuk teknik pembuatan model berorientasi-obyek-object-oriented modeling technique (OMT), yang pada dasarnya dikembangkan untuk pemrograman berorientasi- obyek dan diadaptasi untuk pembuatan model Blaha, Premerlani, dan Rumbaugh. Kelas obyek berkaitan dengan segmen, dan obyek berkaitan dengan bagian tertentu.
B. Arsitektur Database pada Tingkat Logis : Struktur Database Logis
Hubungan- hubungan yang timbul antara segmen- segmen dalam database ditentukan oleh struktur data logis, yang juga disebut skema atau model database. Tiga model utama struktur data logis yang ada dalam literatur adalah :
1. Model pohon atau hirarkis
2. Model jaringan
3. Model relasional
Penjelasannya :
- Model pohon atau hirarkis
Struktur pohon merupakan representasi langsung proses segmentasi yang telah di jelaskan sebelumnya.Dalam struktur pohon,setiap simpul mewakili himpunan field(misalnya,segmen),dan simpul berkaitan dengan node lain yang tingkatanya lebih tinggi dalam struktur pohon.Simpul yang lebih tinggi disebut simpul induk.Hubungan antara induk dan anak di sebut cabang.
Struktur jaringan memungkinkan segmen anak memiliki lebih dari satu induk.struktur pohon dan jaringan keduanya diterapkan dengan penunjuk field(field pointer),dengan segmen lintas-hubung,seperti yang akan di bahas lebih jauh dalam bagian berikutnya.
- Implementasi struktur-struktur pohon dan jaringan
Topik implementasi srtuktur-struktur pohon dan jaringan lebih merupakan bagian dari arsitektur fisik database di bandingkan sebagai arsitektur logis.Dalam organisasi daftar,setiap catatan memuat satu atau lebihponter(field)yang mengindikasikan alamat catatan logis berikutnya yang memiliki atribut yang sama.Catatan dapat merupakan bagian dari beberapa daftar.Daftar ini disebut organisasi multidaftar.
Dua area aplikasi sistem berdasar penunjuk field yang paling berkrmbang adalah hiperteks dan jaringan data semantik.
Model relasional memandang database sebagai kumpulan dua tabel dimensional dibandingkan sebagai struktur jenis hirarkis atau jaringan.Aturan-aturan tertentu di sebut format-format normal mengatur pembuatan tabel-tabel.ketiga format normal adalah sebagai berikut:
Format normal aturan
Format normal pertama membagi tabel untuk mengeliminasi kelompok berulang
Format normal kedua membagi tabel sehingga tidak ada kunci yang memntukan nilai field non-kunci.
Format normal ketiga membagi tabel sehingga tidak ada field non- kunci yang menentukan nilai field non- kunci lainnya.
C. Arsitektur database pada tingkat fisik
Dalam pembahasan tingkat fisik arsitektur database,kita akan berfokus pada tiga metode akses file:Sekuensial,Terindeks,langsung.
- File terakses secara sekuensial
Dalam file akses sekuensial,catatan-catatan hanya dapat di akses dalam sekuens yang telah di tentukan sebelumnya.organisasi file sekuensial bukan merupakan alat sortir data yang bermanfaat jika hanya terdapat sedikit saja catatan yang akan di akses dalam file yang memuat banyak catatan.file sekuensial bermanfaat dalam pemrosesan batch,secara normal mengakses seluruh catatan dalam file.kesimpulannya,organisasi file sekuensial bermanfaat jika di butuhkan pemrosesan batch.
Setiap atribut dapat di ekstrak dari catatan dalam file utama dan di gunakan untuk membuat file baru yang bertujuan menyediakan indeks untuk file asli.File seperti itu di sebut file terindeks atau file terinversi.File dikatakan terinversi secara penuh jika ada indeks untuk seluruh fieldnya.File sekuensial terindeks adalah file sekuensial yang tersimpan dalam DASD dan di indeks serta di sortir secara fisik dalam field yang sama.File-file tersebut umumnya berhubungan dengan file ISAM,dimana ISAM berlaku sebagai kontraksi metode akses sekuensial terindeks.Area utama(primer)merupakan bagian dari disk dimana catatan-catatan aktual di tulis.area tambahan merupakan bagian terpisah dari disk yang di lokasikan bagi file untuk memuat tambahan yang di buat,tanpa melakukan pemrosesan ekstensif terhadap file awal.
- File terakses secara langsung
File terakses secara langsung memungkinkan catatan-catatan individual dapat di panggil secara cepat tanpa menggunakan indeks.Tranformasi random merupakan metode penyimpanan dan penempatan catatan dalam file akses langsung yang di gunakan secara luas.jadi istilah akses random sering kali di gunakan sebagai sinonim dari akses langsung.
D. Hubungan ekonomik antar teknik-teknik organisasi file
Teknik-teknik akses file yang telah di bahas(sekuensial,terindeks,dan akses langsung) cocok untuk situasi-situasi yang berbeda mengiktisarkan kapan masing-masing teknik organisasi file di gunakan.aspek ekonomik pemrosesan file sangat ditentukan oleh rasio aktifitas(jumlah catatan-catatan yang di akses dibagi dengan jumlah catatan dalam file),dan waktu yang dibutuhkan untuk pemrosesan dan inquiri.
Teknik-Teknik organisasi file saat terbaik keterbatasan
Sekuensial rasio aktifitas tinggi,seperti dalam pemrosesan batch
Tidak memungkinkan untuk mengakses catatan tunggal secara cepat
Terindeks rasio aktifitas rendah,ukuran file dari moderat sampai tinggi pemutakhiran file membutuhkan pemutakhiran indeks-indeks
Sekuensial terindeks file harus di proses dengan pola pemrosesan batch(rasio aktifitas tinggi) dan non batch(rasio aktifitas rendah) sama dengan sekuensial dan terindeks
Langsung rasio aktifitas rendah,file berukuran rendah,struktur jaringan,dan struktur pohon memerlukan kunci-kunci untuk menempatkan catatan-catatan
E. Arsitektur fisik,Perangkat keras,dan waktu tanggap
Dari sisi perangkat keras,waktu tanggap di pengaruhi oleh waktu akses fisik.ini adalah waktu yang dibutuhkan CPU untuk melakukan pemanggilan blok tunggal data dari disk,yang disebut waktu akses disk.faktor lain yang dapat mempengaruhi waktu tanggap adalah bagaimana catatan data secara fisik didistribusikan dalam disk.Dalam harddisk,data dalam trek atau silinder yang sama dapat di akses tanpa memindahkan alat baca tulis.harus di tekankan bahwa banyak sistem database yang tergantung pada kegiatan masukan atau keluaran sistem oprasinya.kebutuhan menyimpan file secara berurutanbergantung pada arsitektur fisik database dan metode akses file yang digunakannya.