Monday, July 6, 2015

Pengertian Query


Query memiliki beberapa pengertian yang dan arti yang mendasar. Saya akan menjelaskan beberapa pengertian query.



Query
adalah semacam kemampuan/fungsi untuk menampilkan suatu data dari bank data/data base dimana mengambil dari tabel-tabel yang ada di data base. Namun tidak semua tabel akan ditampilkan sesuai dengan yang kita inginkan. Seperti contoh jika kita ingin mencari data tentang orang yang bersekolah di sekolah X pada tahun 2015-2016, makan yang muncul adalah daftar nama orang yang mendaftar dan biodatanya.

Query
adalah suatu extracting dari suatu data base dan menampilkanya untuk pengelolahan/dioleh lebih lanjut.

Query
adalah permintaan informasi atau pertanyaan tertentu dari sebuah data base yang ditulis dalam format tertentu.

Query
adalah perintah-perintah untuk mengakses data pada sistem basis data.

Query
adalah bahasa yang digunakan untuk melakukan manipulasi terhadap database, yang telah di standar kan dan dikenal dengan nama Structured Query Language (SQL).
 
Bahasa Query
adalah bahas khusus yang digunakan untuk melakukan melakukan query pada basis data.
Contoh penggunaan bahasa query adalah: SELECT ALL WHERE kota=”Yogyakarta” AND umur<30. Query tersebut meminta semua record dari basis data yang sedang digunakan (misalkan basis data konsumen) yang bertempat tinggal di Yogyakarta lebih dari 30 tahun (kota dan umur adalah nama field yang didefinisikan). Standar bahasa query yang banyak digunakan adalah Structured Query Language (SQL). Metode ini paling rumit tetapi paling fleksibel dibandingkan metode query yang lain, query dengan parameter yang telah tersedia dan query by example.

Dengan kata lain query adalah pencarian suatu kata atau istilah dalam search enginedan bisa digunakan untuk memanipulasi data (ketikan keyword di google)

Query dibedakan menjadi 2 yaitu Data Definition Language (DDL) dan Data Manipulation Language(DML)
 
1. Data Definition Language (DDL)
    Untuk membuat atau medefinisikan obyek-obyek database seperti membuat tabel, relasi, dan sebagainya.
2. Data Manipulation Language(DML)
    Untuk memanipulasi data.
 
1. DDL
Struktur/skema basis data yang menggambarkan/mewakili desain basis data secara keseluruhan didefinisikan dengan bahasa khusus yang disebut DDL. Dengan bahasa inilah kita dapat membuat tabel baru, membuat indeks, mengubah tabel, menentukan struktur penyimpanan tabel dan sebagainya. Hasil dari kompilasi perintah DDL adalah kumpulan tabel yang disimpan dalam file khusus yang disebut Kamus Data
Contohnya :
a. Create database : adalah perintah yang di gunakan untuk memulai membuat database.
b. Modify database : adalah perintah yang digunakan untuk memodifikasi database.
c. Create table : adalah perintah yang digunakan untuk membuat tabel.
d. Modify table : adalah perintah yang digunakan untuk memodifikasi table.



2. DML
Merupakan bentuk bahasa basis data yang berguna untuk melakukan manipulasi dan pengambilan data pada suatu basis data. Manipulasi data dapat berupa:
a. Penyisipan/Penambahan data baru ke suatu basis data
b. Penghapusan data dari suatu basis data
c. Pengubahan data dari satu basis data
 
Untuk menambahpengetahuan kunjungi Bagas Bimantoro| Pendidikan Sosial Bima
 

Friday, July 3, 2015

Pengertian Clustering


Ada berbagai macam pengertian tentang cluster/clustering. Singkatnya cluster adalah fenomena dimana search engine mendata dua atau lebih halaman sebuah web dengan sebuah query pencari.
Clustering yang ini bermakna metode penganalisaan data yang tujuannya untuk mengelompokkan data dengan cirikhas dan karateristik yang sama dalam suatu wilayah.

Beberapa pendekatan yang digunakan dalam mengembangkan metode clustering. Dua pendekatan utama adalah clustering dengan pendekatan partisi dan clustering dengan pendekatan hirarki. Clustering dengan pendekatan partisi atau sering disebut dengan partition-based clustering mengelompokkan data dengan memilah-milah data yang dianalisa ke dalam cluster-cluster yang ada. Clustering dengan pendekatan hirarki atau sering disebut dengan hierarchical clustering mengelompokkan data dengan membuat suatu hirarki berupa dendogram dimana data yang mirip akan ditempatkan pada hirarki yang berdekatan dan yang tidak pada hirarki yang berjauhan.
 
Pendekatan partisi
Salah satu metode yang banyak digunakan dalam melakukan clustering dengan partisi ini adalah metode k-means. Secara umum metode k-means ini melakukan proses pengelompokan dengan prosedur sebagai berikut:
  • Tentukan jumlah cluster
  • Alokasikan data secara random ke cluster yang ada
  • Hitung rata-rata setiap cluster dari data yang tergabung di dalamnya
  • Alokasikan kembali semua data ke cluster terdekat
  • Ulang proses nomor 3, sampai tidak ada perubahan atau perubahan yang terjadi masih sudah di bawah treshold
Prosedur dasar ini bisa berubah mengikuti pendekatan pengalokasian data yang diterapkan, apakah crisp atau fuzzy. Setelah meneliti clustering dari sudut yang lain, saya menemukan bahwa k-means clustering mempunyai beberapa kelemahan.

Penjelasan lengkap tentang k-means dapat juga dilihat pada
Mixture Modelling (Mixture Modeling)
Mixture modelling (mixture modeling) merupakan metode pengelompokan data yang mirip dengan k-means dengan kelebihan penggunaan distribusi statistik dalam mendefinisikan setiap cluster yang ditemukan. Dibandingkan dengan k-means yang hanya menggunakan cluster center, penggunaan distribusi statistik ini mengijinkan kita untuk:
  • Memodel data yang kita miliki dengan setting karakteristik yang berbeda-beda
  • Jumlah cluster yang sesuai dengan keadaan data bisa ditemukan seiring dengan proses pemodelan karakteristik dari masing-masing cluster
  • Hasil pemodelan clustering yang dilaksanakan bisa diuji tingkat keakuratannya
Distribusi statistik yang digunakan bisa bermacam-macam mulai dari yang digunakan untuk data categorical sampai yang continuous, termasuk di antaranya distribusi binomial, multinomial, normal dan lain-lain. Beberapa distribusi yang bersifat tidak normal seperti distribusi Poisson, von-Mises, Gamma dan Student t, juga diterapkan untuk bisa mengakomodasi berbagai keadaan data yang ada di lapangan. Beberapa pendekatan multivariate juga banyak diterapkan untuk memperhitungkan tingkat keterkaitan antara variabel data yang satu dengan yang lainnya.

Pendekatan hirarki.

Clustering dengan pendekatan hirarki mengelompokkan data yang mirip dalam hirarki yang sama dan yang tidak mirip di hirarki yang agak jauh. Ada dua metode yang sering diterapkan yaitu agglomerative hieararchical clustering dan divisive hierarchical clustering. Agglomerative melakukan proses clustering dari N cluster menjadi satu kesatuan cluster, dimana N adalah jumlah data, sedangkan divisive melakukan proses clustering yang sebaliknya yaitu dari satu cluster menjadi N cluster.
Beberapa metode hierarchical clustering yang sering digunakan dibedakan menurut cara mereka untuk menghitung tingkat kemiripan. Ada yang menggunakan Single Linkage, Complete Linkage, Average Linkage, Average Group Linkage dan lain-lainnya. Seperti juga halnya dengan partition-based clustering, kita juga bisa memilih jenis jarak yang digunakan untuk menghitung tingkat kemiripan antar data.
Salah satu cara untuk mempermudah pengembangan dendogram untuk hierarchical clustering ini adalah dengan membuat similarity matrix yang memuat tingkat kemiripan antar data yang dikelompokkan. Tingkat kemiripan bisa dihitung dengan berbagai macam cara seperti dengan Euclidean Distance Space. Berangkat dari similarity matrix ini, kita bisa memilih lingkage jenis mana yang akan digunakan untuk mengelompokkan data yang dianalisa.

Maaf jika ada kesalahan, saya masih newbie
Jika anda ingin menambah pengetahuan kunjungi   Bagas Bimantoro| Pendidikan Sosial Bima