Senin, 18 November 2013

Tugas 3 Pengamanan Telematika

Jelaskan bagaimana cara pengamanan layanan telematika dilihat dari aspek jaringan komputernya baik yang menggunakan kabel maupun tanpa kabel (wireless)!


Cara pengamanan layanan telematika yang dilihat dari aspek jaringan computer yang menggunakan kabel atau wirelese itu ada 4 yaitu :

A.  Layanan Informasi
Pengertian layanan informasi adalah penyampaian berbagai informasi kepada sasaran layanan agar individu dapat memanfaatkan informasi tersebut demi kepentingan hidup dan perkembangannya. Informasi dapat disajikan dalam berbagai format seperti: teks, gambar, audio, maupun video.
Beberapa contoh dari layanan informasi adalah :
a. M – Commerce
b. GPS
c. News and weather
d. Telematik Terminal
e. Jasa pelayanan internet
f. Informasi lalu lintas terbaru

B.  Layanan Keamanan
Layanan keamanan adalah suatu yang sangat penting untuk menjaga agar suatu data dalam jaringan tidak mudahterhapus atau hilang. Sistem dari keamanan ini juga membantu untuk mengamankan jaringan tanpa menghalangi penggunaannya dan menempatkan antisipasi ketika jaringan berhasil ditembus. Keamanan jaringan di sini adalah memberikan peningkatan keamanan tertentu untuk jaringan serta untuk memantau dan memberikan informasi jika sesuatu berjalan tidak seharusnya.

Layanan ini dapat mengurangi tingkat pencurian dan kejahatan. Peningkatan keamanan jaringan ini dapat dilakukan terhadap :
a. Rahasia (privacy)
Dengan banyak pemakai yang tidak dikenal pada jaringan menyebabkan penyembunyian data yang sensitive menjadi sulit.
b. Keterpaduan data (data integrity)
Karena banyak node dan pemakai berpotensi untuk mengakses system komputasi, resiko korupsi data adalah lebih tinggi.
c. Keaslian (authenticity)
Hal ini sulit untuk memastikan identitas pemakai pada system remote, akibatnya satu host mungkin tidak mempercayai keaslian seorang pemakai yang dijalankan oleh host lain.
d. Convert Channel
Jaringan menawarkan banyak kemungkinan untuk konstruksi convert channel untuk aliran data, karena begitu banyak data yang sedang ditransmit guna menyembunyikan pesan.

Keamanan dapat didefinisikan sebagai berikut :
a. Integrity
Mensyaratkan bahwa informasi hanya dapat diubah oleh pihak yang memiliki wewenang.
b. Confidentiality
Mensyaratkan bahwa informasi (data) hanya bisa diakses oleh pihak yang memiliki wewenang.
c. Authentication
Mensyaratkan bahwa pengirim suatu informasi dapat diidentifikasi dengan benar dan ada jaminan bahwa identitas yang didapat tidak palsu.
d. Availability
Mensyaratkan bahwa informasi tersedia untuk pihak yang memiliki wewenang ketika dibutuhkan.
e. Nonrepudiation
Mensyaratkan bahwa baik pengirim maupun penerima informasi tidak dapat menyangkal pengiriman dan penerimaan pesan.

C. Layanan Context - Aware - Event Base
Context Aware atau istilah lainnya context-awareness diperkenalkan oleh Schilit pada tahun 1994, dengan gagasan yang menyatakan bahwa perangkat komputer memiliki kepekaan dan dapat bereaksi terhadap lingkungan sekitarnya berdasarkan informasi dan aturan-aturan tertentu yang tersimpan di dalam perangkat.
Istilah context-awareness mengacu kepada kemampuan layanan network untuk mengetahui berbagai konteks, yaitu kumpulan parameter yang relevan dari pengguna (user) dan penggunaan network itu, serta memberikan layanan yang sesuai dengan parameter-parameter itu. Beberapa konteks yang dapat digunakan antara lain lokasi user, data dasar user, berbagai preferensi user, jenis dan kemampuan terminal yang digunakan user.
Tiga hal yang menjadi perhatian sistem context-aware menurut Albrecht Schmidt, yaitu:
a. The acquisition of context
Hal ini berkaitan dengan pemilihan konteks dan bagaimana cara memperoleh konteks yang diinginkan, sebagai contoh : pemilihan konteks lokasi, dengan penggunaan suatu sensor lokasi tertentu (misalnya: GPS) untuk melihat situasi atau posisi suatu lokasi tersebut.
b. The abstraction and understanding of context
Pemahaman terhadap bagaimana cara konteks yang dipilih berhubungan dengan kondisi nyata, bagaimana informasi yang dimiliki suatu konteks dapat membantu meningkatkan kinerja aplikasi, dan bagaimana tanggapan sistem dan cara kerja terhadap inputan dalam suatu konteks.
c. Application behaviour based on the recognized context
Terakhir, dua hal yang paling penting adalah bagaimana pengguna dapat memahami sistem dan tingkah lakunya yang sesuai dengan konteks yang dimilikinya serta bagaimana caranya memberikan kontrol penuh kepada pengguna terhadap sistem.

D.  Layanan Perbaikan Sumber
Layanan perbaikan sumber yang dimaksud adalah layanan perbaikan dalam sumber daya manusia (SDM). SDM telematika adalah orang yang melakukan aktivitas yang berhubungan dengan telekomunikasi, media, dan informatika sebagai pengelola, pengembang, pendidik, dan pengguna di lingkungan pemerintah, dunia usaha, lembaga pendidikan, dan masyarakat pada umunya.
Konsep pengembangan sumber daya manusia di bidang telematika ditujukan untuk meningkatkan kualitas, kuantitas dan pendayagunaan SDM telematika dengan tujuan untuk mengatasi kesenjangan digital, kesenjangan informasi dan meningkatkan kemandirian masyarakat dalam pemanfaatan teknologi informasi dan komunikasi secara efektif dan optimal.

Kebutuan akan SDM dapat dilihat dari bidang ekonomi dan bidang politik, yaitu :
a.  Dilihat dari bidang ekonomi
Pengembangan telematika ditujukan untuk peningkatan kapasitas ekonomi, berupa peningkatan kapasitas industry produk barang dan jasa.  
b. Dilihat dari bidang politik
Bagaimana telematika memberikan kontribusi pada pelayanan public sehingga menghasilkan dukungan politik.
Dari kedua bidang tersebut diatas kebutuhan terhadap telematika akan dilihat dari dua aspek, yaitu:
1. Pengembangan peningkatan kapasitas industry.
2. Pengembangan layanan publik.

Jelaskan motif-motif gangguan yang terjadi pada layanan telematika!

Serangan (gangguan) terhadap keamanan dapat dikategorikan dalam empat kategori utama:

a. Interruption
Suatu aset dari suatu sistem diserang sehingga menjadi tidak tersedia atau tidak dapat dipakai oleh yang berwenang. Contohnya adalah perusakan/modifikasi terhadap piranti keras atau saluran jaringan.

b. Interception
Suatu pihak yang tidak berwenang mendapatkan akses pada suatu aset. Pihak yang dimaksud bisa berupa orang, program, atau sistem yang lain. Contohnya adalah penyadapan terhadap data dalam suatu jaringan.

c. Modification
Suatu pihak yang tidak berwenang dapat melakukan perubahan terhadap suatu aset. Contohnya adalah perubahan nilai pada file data, modifikasi program sehingga berjalan dengan tidak semestinya, dan modifikasi pesan yang sedang ditransmisikan dalam jaringan.

d. Fabrication
Suatu pihak yang tidak berwenang menyisipkan objek palsu ke dalam sistem. Contohnya adalah pengiriman pesan palsu kepada orang lain.

Jelaskan satu contoh metode pengamanan terhadap layanan telematika!

Sebuah metode browsing jaringan disediakan untuk browsing video atau audio data yang di tembak oleh sebuah IP. Jaringan video atau audio metode browsing sesuai mencangkup langkah-langkah dari:
a. Menjalankan sebuah program splikasi komputetr local untuk mendapatkan kode identifikasi yang disimpan dalam kamera IP.
b. Transmisi untuk mendaftarkan kode identifikasi ke DDNS (Dinamic Domain Name Server) oleh program aplikasi.
c. Mendapatkakn kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan IO kamera dan control kamera IP melalui kamera IP pribadi, dan
d. Kopel ke layanan server melalui alamat server pribadi sehina untuk mendapatkan video atau audio dari yang ditembak oleh kamera IP, dimana server layanan menangkap video atau audio data yang ditembak oleh kamera IP melalui Internet.

READ MORE Tugas 3 Pengamanan Telematika

Selasa, 15 Oktober 2013

Fitur Layout Telematika

Perkembangan Jaringan Komputer Dalam Telematika
Kemajuan teknologi komputer sebagai pengolah data berkembang semakin cepat. Sejak terjadi penggabungan teknologi komputer dengan teknologi komunikasi, maka pengolahan data yang semula saling terpisah antar unit computer sekarang dapat saling dihubungkan melalui system jaringan komputer. Karena jaringan computer secara sederhana merupakan hubungan antarkomputer yang berjumlah dua atau lebih. Dengan adanya jaringan komputer ini akan membuat komputer dapat melakukan banyak hal dan dapat membantu efisiensi dan efektivitas dalam dunia kerja. Misalnya, dengan adanya jaringan komputer, maka tidak perlu lagi satu computer memiliki satu printer, tetapi dengan satu printer saja dapat digunakan oleh beberapa komputer secara bersama tanpa harus memindahkan printer tersebut setiap kali mencetak.

Selain itu manfaat lain dari adanya jaringan komputer adalah adanya pertukaran data, sehingga tidak perlu lagi menggunakan media penyimpan seperti disket atau flashdisk dalam melakukan pemindahan data. Perkembangan lain dari jaringan computer dari sisi bisnis adalah memanfaatkan pelaporan data dan monitoring perkembangan bisnis, seperti kontroling peningkatan target penjualan barang.

Secara umum, jaringan komputer mempunyai beberapa manfaat yang lebih dibandingkan dengan computer yang berdiri sendiri, yaitu:

  1. Jaringan komputer memungkinkan manajemen sumber daya yang lebih efisien.
  2. Jaringan computer membantu pertahanan informasi agar tetap handal dan up to date. System penyimpanan data terpusat yang dikelola dengan baik memungkinkan banyak pengguna mengakses data dari berbagai lokasi yang berbeda.
  3. Jaringan computer membantu mempercepat proses berbagi data(data sharing). Transfer data pada sebuah jaringan lebih cepat dibandingkan dengan berbagi data menggunakan yang bukan jaringan.
  4. Jaringan computer memungkinkan kelompok kerja berkomunikasi dengan lebih efisien.
  5. Jaringan computer membantu usaha dalam melayani klien mereka secara lebih efektif.
Perkembangan Wireless.

Norman Abramson, seorang profesor di Universitas Hawaii, mengembangkan jaringan komunikasi komputer nirkabel pertama di dunia, ALOHAnet, yang berbiaya rendah dan hampir serupa radio. Sistem ini melibatkan tujuh komputer dari empat pulau untuk berkomunikasi dengan komputer pusat di Pulau Oahu tanpa menggunakan saluran telepon.Pada tahun 1979, FR Gfeller dan U. Bapst menerbitkan makalah di IEEE Prosiding yang berisi laporan tentang ujicoba jaringan nirkabel untuk komunikasi dengan menggunakan inframerah-tersebar. Tak lama kemudian, pada tahun 1980, P. Ferrert melaporkan percobaannya tentang aplikasi eksperimental dari sebuah kode tunggal penyebaran spektrum radio untuk komunikasi terminal nirkabel dalam Konferensi Nasional Telekomunikasi IEEE.

Pada tahun 1984, perbandingan antara inframerah dan komunikasi spread spectrum CDMA untuk jaringan informasi kantor nirkabel diterbitkan oleh Kaveh Pahlavan dalam Simposium Jaringan Komputer IEEE yang kemudian terbit di Majalah Komunikasi IEEE Masyarakat. Pada bulan Mei 1985, upaya Marcus telah membuat FCC mengumumkan eksperimental band ISM untuk aplikasi komersial teknologi spektrum sebar. Kemudian, M. Kavehrad melaporkan sebuah sistem PBX nirkabel eksperimental menggunakan divisi kode akses. Laporan-laporan ini mendorong kegiatan industri radio portabel dan ponsel yang signifikan dalam pengembangan generasi baru jaringan area lokal nirkabel dan perbaruan diskusi dan informasi-informasi dalam bidang ini.

Generasi pertama dari modem data nirkabel dikembangkan pada awal tahun 1980 oleh operator radio amatir, yang sering disebut sebagai radio paket. Mereka menambahkan sebuah modem band suara  komunikasi data, dengan kecepatan data di bawah 9.600-bit /s, untuk sistem radio jarak pendek yang ada, biasanya dalam band amatir yang berjarak dua meter. Generasi kedua modem nirkabel dikembangkan segera setelah pengumuman FCC di band eksperimental untuk penggunaan teknologi spektrum-sebar non-militer. Modem ini berkecepatan data  ratusan kbit/s. Generasi ketiga dari modem nirkabel kemudian ditujukan untuk kompatibilitas dengan LAN yang ada dengan kecepatan data dalam Mbit/s. Beberapa perusahaan mengembangkan produk generasi ketiga dengan kecepatan data diatas 1 Mbit/s dan beberapa produk sudah diumumkan pada lokakarya IEEE Workshop tentang Wireless LAN.

Gambar 54 Mbit/s WLAN PCI Card (802.11g)

Pada Lokakarya IEEE pertama perihal LAN Nirkabel diadakan pada tahun 1991. Pada saat itu produk pertama LAN nirkabel baru saja muncul di pasar dan komite IEEE 802.11 baru saja memulai kegiatannya untuk mengembangkan sebuah standar LAN nirkabel. Fokus lokakarya pertama adalah evaluasi terhadap teknologi alternatif. Pada tahun 1996, teknologi ini dianggap telah cukup berkembang, berbagai aplikasi telah diidentifikasi dan teknologi yang memungkinkan aplikasi ini telah pula dipahami dengan baik. Chip set ditujukan untuk implementasi dan aplikasi LAN nirkabel, yang menjadi kunci teknologi untuk pertumbuhan pasar yang cepat. Wireless LAN semakin banyak digunakan di rumah sakit, bursa efek, di gedung-gedung seperti kampus dan perkantoran untuk akses nomaden, jaringan LAN point-to-point, jaringan ad-hoc, dan aplikasi yang lebih besar melalui internetworking.  Standar, varian dan alternatif IEEE 802.11 seperti forum interoperabilitas wireless LAN dan Eropa HiperLAN telah membuat kemajuan pesat demikian halnya dengan PCS tak berlisensi ‘Layanan Komunikasi Pribadi’ dan supernet, yang kemudian diubah namanya menjadi U-NII, telah membuka peluang baru.


Perangkat WLAN pada awalnya begitu mahal dan digunakan sebagai alternatif LAN kabel di tempat dimana pengkabelan sangat sulit atau tidak mungkin. Pengembangan utama meliputi solusi spesifik industri and protokol proprietary, tetapi pada akhir 1990-an digantikan dengan standar, versi, dan jenis utama dari IEEE 802.11 (dalam produk dengan menggunakan Wi-Fi sebagai nama merek). Namun, ada juga beberapa produk yang tidak berhasil di pasaran, seperti ATM alternatif dengan menggunakan teknologi standar 5 GHz, yaitu HiperLAN/2. Sejak tahun 2002 telah ada standar yang lebih baru ditambahkan ke 802,11; 802.11n yang beroperasi di kedua band yakni 5GHz dan 2,4 Ghz pada kecepatan 300 Mbit/s, dengan begitu, kebanyakan router yang lebih baru termasuk yang diproduksi oleh Apple Inc telah dapat disiarkan jaringan nirkabel pada kedua band nirkabel, yang disebut dualband. Sebuah HomeRF yang dibentuk pada tahun 1997 telah pula mempromosikan teknologi yang bertujuan untuk digunakan di rumah, tetapi gagal dan dibubarkan pada akhir 2002.

Dibawah ini adalah contoh dari perangkat dan jenis untuk perlengkapan WIfi (Wireless Network)

Hardware Access Point + plus
Perangkat dibawah ini adalah perangkat standard yang digunakan untuk access point. Access Point dapat berupa perangkat access point saja atau dengan dual fungsi sebagai internal router. Bahkan pada model terbaru sudah ditambahkan teknologi Super G dengan kemampuan double transmisi, smart DHCP bagi client network dan hardware standard monitor serta Firewall dan sebagainya.
Alat Access point dapat dipasangkan pada sebuah hub, cable modem atau alat lainnya untuk menghubungkan computer dengan WIFI kedalam sebuah network lain.

PCMCIA Adapter
Alat ini dapat ditambahkan pada notebook dengan pada PCMCIA slot. Model PCMCIA juga tersedia dengan tipe G atau double transmit..

USB Wireless Adaptor
Termasuk perangkat baru dan praktis pada teknologi WIFI. Alat ini mengambil power 5V dari USB port. Untuk kemudahan USB WIFI adapter dengan fleksibel ditempatkan bagi notebook dan PC. Tetapi pada perangkat USB WIFI Adapter memiliki batasan. Sebaiknya mengunakan USB port 2.0 karena kemampuan sistem WIFI mampu mencapai data rate 54Mbps. Bila anda memerlukan kepraktisan, penambahan perangkat Wireless USB adaptor adalah pilihan yang tepat, karena bentuknya yang praktis dan dapat dilepas. Tetapi perlu diingatkan bahwa dengan supply power kecil dari USB port alat juga memilki jangkauan lebih rendah, selain bentuk antenna yang ditanam didalam cover plastik akan menghambat daya pancar dan penerimaan pada jenis perangak ini.

USB Add-on PCI slot
Perangkat ini umumnya diberikan bersama paket mainboard untuk melengkapi perangkat WIFI pada sebuah computer. Sama kemampuannya dengan PCI card wireless network tetapi mengunakan jack USB internal pada mainboard termasuk pemakaian power diambil dari cable tersebut. Perangkat pada gambar dibawah ini juga dapat diaktifkan sebagai Access Point melalui software driver. Kekuatan alat ini terletak pada antenna, dan memiliki jangkauan sama seperti PCI Wireless adaptor.

Mini PCI bus adapter
Perangkat miniPCI bus untuk WIFI notebook berbentuk card yang ditanamkan didalam case notebook. Berbeda dengan card yang digunakan pada computer dengan PCI interface. PCImini bus adalah slot PCI yang disediakan pada notebook dan pemakai dapat menambahkan perangkat seperti WIFI adaptor didalam sebuah notebook. Umumnya perangkat hardware dengan miniPCI bus tidak dijual secara umum, tetapi model terbaru seperti pada Gigabyte GN-WIAG01 dengan kemampuan WIFI Super G sudah dijual bebas untuk upgrade Wireless adaptor bagi sebuah notebook.

Perangkat mini PCI untuk wireless nantinya diberikan 2 buah socket antena dan terhubung dengan antena di sisi layar sebuah notebook. Untuk keterangan dimana perangkat ini dipasang, dapat dilihat pada gambar menginstall Mini PCI bus.

Install Mini PCI bus Wireless Adaptor
Adalah contoh sebuah notebook dengan interface PCIbus yang masih kosong. Bila sebuah notebook sudah mendukung teknologi WIFI, biasanya sudah disediakan 2 kabel antenna yang menghubungkan PCIbus card ke external antenna. Adalah penempatan jack antenna untuk PCImini card WIFI

PCI card wireless network
PCIcard Wireless network dapat juga berupa sebuah card WIFI yang ditancapkan pada slot computer atau dengan mengambil power dari USB tetapi dipasangkan pada PCI slot. Perangkat Wireless network dapat juga diaktifkan menjadi Access point. Perangkat jenis PCI card dipasangkan permanen pada sebuah desktop PC.




Berikut ini adalah software yang biasa digunakan dalam teknologi wireless :

1.Wireless Wizard
Meningkatkan keandalan dan penggunaan dari setiap WiFi, WiMAX, LTE, 3G atau jaringan data nirkabel.
2.Easy wifi radar
untuk menemukan dan terhubung untuk membuka jalur akses nirkabel dengan mouseclick tunggal. Terhubung ke hotspot gratis tanpa kerumitan.
3.Advanced port scanner
dapat memindai port sangat cepat, berisi deskripsi untuk port umum, dan dapat melakukan scan pada rentang port yang telah ditentukan.
4.AirSnare
adalah aplikasi Wi-Fi besar bagi mereka situasi di mana Anda benar-benar perlu untuk terhubung ke jaringan terbuka.
5.Wireless Protector Enterprise 1.3
Wireless Protector manajemen berbasis windows dan perangkat lunak keamanan yang secara otomatis menonaktifkan WiFi adapter pada komputer yang terhubung ke jaringan LAN perusahaan dan kembali mengaktifkan WiFi ketika kabel LAN diputus dari komputer nirkabel. Perangkat lunak ini bertindak sebagai server untuk semua komputer nirkabel dilindungi dan perlu diinstal hanya sekali pada platform windows aktif yang dihubungkan dengan kabel LAN ke jaringan perusahaan.

Fitur Layout Telematika

Pada dasarnya, fitur layout telematika terbagi 6 macam fitur layanan antara lain :

1. Head Up Display System
Head Up Display (HUD) merupakan sebuah tampilan transparan yang menampilkan data tanpa mengharuskan penggunanya untuk melihat ke arah yang lain dari sudut pandang biasanya. Asal nama dari alat ini yaitu pengguna dapat melihat informasi dengan kepala yang terangkat (head up) dan melihat ke arah depan daripada melihat ke arah bawah bagian instrumen. Walaupun HUD dibuat untuk kepentingan penerbangan militer (kayaknya jaman dulu sampe sekarang teknologi itu dipakai militer dulu baru di kasih ke orang sipil, trus kapan orang sipil bisa punya teknologi?), sekarang HUD telah digunakan pada penerbangan sipil, kendaraang bermotor dan aplikasi lainnya.

2. Tangible User Interface
Tangible User Interface, yang disingkat TUI, adalah antarmuka dimana seseorang dapat berinteraksi dengan informasi digital lewat lingkungan fisik. Nama inisial Graspable User Interface, sudah tidak lagi digunakan. Salah satu perintis TUI ialah Hiroshi Ishii, seorang profesor di Laboratorium Media MIT yang memimpin Tangible Media Group. Pandangan istimewanya untuk tangible UI disebut tangible bits, yaitu memberikan bentuk fisik kepada informasi digital sehingga membuat bit dapat dimanipulasi dan diamati secara langsung.

3. Computer Vision
Computer Vision (komputer visi) merupakan ilmu pengetahuan dan teknologi dari mesin yang melihat. Dalam aturan pengetahuan, komputer visi berhubungan dengan teori yang digunakan untuk membangun sistem kecerdasan buatan yang membutuhkan informasi dari citra (gambar). Data citranya dapat dalam berbagai bentuk, misalnya urutan video, pandangan deri beberapa kamera, data multi dimensi yang di dapat dari hasil pemindaian medis.

4. Browsing Audio Data
Browsing Audio Data merupakan metode browsing jaringan yang digunakan untuk browsing video / audio data yang ditangkap oleh sebuah IP kamera. Jaringan video / audio metode browsing mencakupi langkah-langkah sebagai berikut :

a. Menjalankan sebuah program aplikasi komputer lokal untuk mendapatkan kode 
identifikasi yang disimpan dalam kamera IP
b. Transmisi untuk mendaftarkan kode identifikasi ke DDNS ( Dynamic Domain Name 
Server) oleh program aplikasi
c. Mendapatkan kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan 
IP kamera dan kontrol kamera IP melalui kamera IP pribadi alamat dan alamat 
server pribadi
d. Compile ke layanan server melalui alamat server pribadi sehingga untuk 
mendapatkan video / audio data yang ditangkap oleh kamera IP, dimana server 
layanan menangkap video / audio data melalui Internet.

5. Speech Recognition
Dikenal juga dengan pengenal suara otomatis (automatic speech recognition) atau pengenal suara komputer (computer speech recognition). Merupakan salah satu fitur antarmuka telematika yang merubah suara menjadi tulisan (hebat, padahal kalo lagi di dikte sama dosen juga kita bisa ngubah suara jadi tulisan). Istilah ‘voice recognition’ terkadang digunakan untuk menunjuk ke speech recognition dimana sistem pengenal dilatih untuk menjadi pembicara istimewa, seperti pada kasus perangkat lunak untuk komputer pribadi, oleh karena itu disana terdapat aspek dari pengenal pembicara, dimana digunakan untuk mengenali siapa orang yang berbicara, untuk mengenali lebih baik apa yang orang itu bicarakan. Speech recognition merupakan istilah masukan yang berarti dapat mengartikan pembicaraan siapa saja.

6. Speech Synthesis
Speech synthesis merupakan hasil kecerdasan buatan dari pembicaraan manusia. Komputer yang digunakan untuk tujuan ini disebut speech syhthesizer dan dapat diterapkan pada perangkat lunak dan perangkat keras. Sebuah sistem text to speech (TTS) merubah bahasa normal menjadi pembicaraan.

READ MORE Fitur Layout Telematika

Rabu, 02 Oktober 2013

TELEMATIKA

Definisi Telematika
Telematika merupakan adopsi dari bahasa Prancis yang sebenarnya adalah “TELEMATIQUE” yang kurang lebih dapat diartikan sebagai bertemunya sistem jaringan komunikasi dengan teknologi informasi. Para praktisi mengatakan bahwa TELEMATICS merupakan perpaduan dari dua kata yaitu dari “TELECOMMUNICATION and INFORMATICS” yang merupakan perpaduan konsep Computing and Communication. Istilah telematika juga dikenal sebagai “the new hybrid technology” karena lahir dari perkembangan teknologi digital. Dalam wikipedia disebutkan bahwa Telematics juga sering disebut dengan ICT (Information and Communications Technology).
Salah satu milis internet Indonesia terbesar adalah milis Telematika. Dari milis inipun tidak ada penjelasan mengapa milis ini bernama telematika, yang jelas arsip pertama kali tercatat dikirimkan pada tanggal 15 Juli 1999. Dari hasil pencarian di arsip mailing list Telematika saya menemukan salah satu ulir diskusi menarik (membutuhkan login) tentang penamaan Telematika yang dikirimkan oleh Paulus Bambang Wirawan.

Istilah telematika sering dipakai untuk beberapa macam bidang, sebagai contoh adalah:
  • Integrasi antara sistem telekomunikasi dan informatika yang dikenal sebagai Teknologi Komunikasi dan Informatika atau ICT (Information and Communications Technology). Secara lebih spesifik, ICT merupakan ilmu yang berkaitan dengan pengiriman, penerimaan dan penyimpanan informasi dengan menggunakan peralatan telekomunikasi.
  • Secara umum, istilah telematika dipakai juga untuk teknologi Sistem Navigasi/Penempatan Global atau GPS (Global Positioning System) sebagai bagian integral dari komputer dan teknologi komunikasi berpindah (mobile communication technology).
  • Secara lebih spesifik, istilah telematika dipakai untuk bidang kendaraan dan lalulintas (road vehicles dan vehicle telematics).

Media Komunikasi Yang Digunakan

Yang termasuk dalam layanan telematika di bidang komunikasi adalah layanan dial up ke Internet maupun semua jenis jaringan yang didasarkan pada sistem telekomunikasi untuk mengirimkan data. Internet sendiri merupakan salah satu contoh telematika.


Contoh lainnya, sekarang semua orang sudah mempunyai handphone, dan semakin hari semakin pesat perkembangan teknologinya, dan semakin memudahkan para penggunanya untuk mendapatkan informasi secara langsung baik itu dari sms maupun push email yg lagi booming-nya di Indonesia akibat pasar handphone blackberry atau sekedar browsing dengan menggunakan wifi ataupun WAP.

Selain itu, layanan video conference merupakan layanan komunikasi yang melibatkan video dan audio secara real time. Teknologi yang digunakan untuk layanan video conference komersial pada awalnya dikembangkan di atas platform ISDN (Integrated Switch Digital Network) dengan standar H.320. Secara fungsional, elemen pendukung layanan video conference terdiri dari:

  • Terminal video conference atau endpoint video conference, adalah perangkat yang berada di sisi pengguna video conference.
  • MCU (Multipoint Conference Unit), adalah semacam server yang berfungsi sebagai pengendali konferensi yang melibatkan banyak pengguna dan banyak sesi konferensi.
  • Gateway dan gatekeeper adalah media yang melakukan proses adaptasi komunikasi video conference berbasis ISDN ke IP dan sebaliknya.
Jenis Video Conference
Jenis video conference berdasarkan hubungan diantara pemakainya dapat dibagi menjadi tiga bagian :
  1. Real Time Colaboration Multiparty Conferencing, merupakan sarana hubungan konferensi yang seketika dengan resolusi yang baik dan interaktif.
  2. Active Participation Users, hubungan yang terjadi diantara pemakai dengan jaringan komputer atau basis data, merupakan konferensi yang seketika dengan resolusi yang baik dan interaktif.
  3. Passive Participation Users, keikutsertaan pemakai bersifat pasif dan memerlukan hubungan yang seketika dan interaktif.
Perkembangan Telematika

Perkembangan Telematika dari sebelum dan sesudah ada internet, Contohnya perkembangan telematika di Indonesia. Peristiwa proklamasi 1945 membawa perubahan yang bagi masyarakat Indonesia, dan sekaligus menempatkannya pada situasi krisis jati diri. Krisis ini terjadi karena Indonesia sebagai sebuah negara belum memiliki perangkat sosial, hukum, dan tradisi yang mapan. Situasi itu menjadi ‘bahan bakar’ bagi upaya-upaya pembangunan karakter bangsa di tahun 50-an dan 60-an. Di awal 70-an, ketika kepemimpinan soeharto, orientasi pembangunan bangsa digeser ke arah ekonomi, sementara proses – proses yang dirintis sejak tahun 50-an belum mencapai tingkat kematangan.

Dalam latar belakang sosial demikianlah telekomunikasi dan informasi, mulai dari radio, telegrap, dan telepon, televise, satelit telekomunikasi, hingga ke internet dan perangkat multimedia tampil dan berkembang di Indonesia. Perkembangan telematika penulis bagi menjadi 2 masa yaitu masa sebelum atau pra satelit dan masa satelit.

1. Masa Pra-Satelit
Radio dan Telepon
Di periode pra satelit (sebelum tahun 1976), perkembangan teknologi komunikasi di Indonesia masih terbatas pada bidang telepon dan radio. Radio Republik Indonesia (RRI) lahir dengan di dorong oleh kebutuhan yang mendesak akan adanya alat perjuangan di masa revolusi kemerdekaan tahun 1945, dengan menggunakan perangkat keras seadanya. Dalam situasi demikian ini para pendiri RRI melangsungkan pertemuan pada tanggal 11 September 1945 untuk merumuskan jati diri keberadaan RRI sebagai sarana komunikasi antara pemerintah dengan rakyat, dan antara rakyat dengan rakyat.
Sedangkan telepon pada masa itu tidak terlalu penting sehingga anggaran pemerintah untuk membangun telekomunikasipun masih kecil jumlahnya. Saat itu, telepon dikelola oleh PTT (Perusahaan Telepon dan Telegrap) saja. Sampai pergantian rezim dari Orla ke Orba di tahun 1965, RRI merupakan operator tunggal siaran radio di Indonesia. Setelah itu bermunculan radio – radio siaran swasta. Lima tahun kemudian muncul PP NO. 55 tahun 1970 yang mengatur tentang radio siaran non pemerintah.


Periode awal tahun 1960-an merupakan masa suram bagi pertelekomunikasian Indonesia, para ahli teknologi masih menggeluti teknologi sederhana dan “kuno”. Misalnya saja, PTT masih menggunakan sentral-sentral telepon yang manual, teknik radio High Frequency ataupun saluran kawat terbuka (Open Were Lines). Pada masa itu, banyak negara pemberi dana untuk Indonesia – termasuk pendana untuk pengembangan telekomunikasi, menghentikan bantuannya. Hal itu karena semakin memburuknya situasi dan kondisi ekonomi dan politi di Indonesia.
Tercatat bahwa pada masa 1960-1967, hanya Jerman saja yang masih bersikap setia dan menaruh perhatian besar pada bidang telekomunikasi Indonesia, dan menyediakan dana walau di masa-masa sulit sekalipun. Ketika itu pengembangan telekomunikasi masih difokuskan pada pengadaan sentra telepon, baik untuk komunikasi lokal maupun jarak jauh, dan jaringan kabel. Indonesia saat itu belum memiliki satelit. Sentral telepon beserta perlengkapan hubungan jarak jauh ini diperoleh dari Jerman. Pada saat itu, Indonesia hanya dapat membeli produk yang sama, dari perusahaan yang sama, yakni Perusahaan Jerman. Tidak ada pilihan lain bagi Indonesia.
Keleluasaan barulah bisa dirasakan setelah di tahun 1967/1968 mengalir pinjaman-pinjaman ke Indonesia, baik bilateral ataupun pinjaman multilateral dari Bank Dunia, melalui pinjaman yang disepakati IGGI. Akan tetapi, pada masa inipun inovasi dalam pemfungsian teknologi telekomunikasi masih belum berkembang dengan baik di negeri ini. Peda dasarnya kita memberi dan memakai perlengkapan seperti switches, cables, carries yang sudah lazim kita pakai sebelumnya.

Televisi
Badan penyiaran televisi lahir tahun 1962 sebelum adanya satelit yang semula hanya dimaksudkan sebagai perlengkapan bagi penyelenggara Asian Games IV di Jakarta. Siaran percobaan pertama kali terjadi pada 17 Agustus 1962 yang menyiarkan upacara peringatan kemerdekaan RI dari Istana Merdeka melalui microwave. Dan pada tanggal 24 Agustus 1962, TVRI bisa menyiarkan upacara pembukaan Asian Games, dan tanggal itu dinyatakan sebagai hari jadi TVRI. 
Terdorong oleh inovasi, akhirnya pada tanggal 14 November 1962 untuk pertama kalinya TVRI memberanikan diri melakukan siaran langsung dari studio yang berukuran 9x11 meter dan tanpa akustik yang memadai. Acaranya terbatas, hanya berupa permainan piano tunggal oleh B.J. Supriadi dengan pengaruh acara Alex Leo. 
Lebih setahun setelah siaran pertama, barulah keberadaan TVRI dijelaskan dengan pembentukan Yayasan TVRI melalui Keppres No. 215/1963 tertanggal 20 oktober 1963. Antara lain disebutkan bahwa TVRI menjadi alat hubungan masyarakat (mass communication media) dalam pembangunan mental/spiritual dan fisik daripada Bangsa dan Negara Indonesia serta pembentukan manusia sosialis Indonesia pada khususnya.
Sampai tahun 1989, TVRI merupakan operator tunggal di bidang penyiaran televise.
Jadi sebelum satelit palapa mengorbit, Indonesia hanya mengenal telekomunikasi yang bersifat terestrial, yakni yang jangkauannya masih dibatasi oleh lautan. Telekomunikasi seperti ini tidak bisa menjangkau pulau-pulau kecuali melalui penggunaan SKKL (Saluran Komunikasi Kabel Laut) yang mahal dan sulit dipergunakan.

2. Masa Satelit

Satelit Domestik Palapa
Gagasan tentang peluncuran satelit bagi telekomunikasi domestik di Indonesia bisa ditelusuri asal muasalnya dari sebuah konferensi di Janewa tahun 1971 yang disebut WARCST (World Administrative Radio Confrence on Space Telecomunication). 
Pada konferensi itu di tampilkan pila pameran dari perusahaan raksasa pesawat terbang Hughes. Perusahaan inilah yang mengusulkan ide pemanfaatan satelit bagi kepentingan domestik Indonesia. Hal tersebut disambut oleh Suhardjono yang berlatar belakang militer dan membawa masalah satelit itu sampai ke Presiden RI. 
Selain pertimbangan kelayakan ekonomi dan teknis, sejarah peluncuran satelit ini juga diwarnai oleh kepentingan politik dimana hubungan antara Indonesia dengan negara- negara lain sudah mulai bersahabat. Di sisi lain, satelit memungkinkan penyebaran luas ideologi negara ke masyarakat luas melalui TV, satelit juga menguntungkan secara ekonomi. 
Komunikasi tentang cara-cara menggali sumber daya alam dapat berlangsung dengan mudah. Ini berlaku untuk kasus tembaga pura (Freeport) dan di Dili. Peluncuran satelit Palapa di Cape Canaveral, Florida, bulan Agustus 1976 pada panel peluncuran terdapat 3 orang Indonesia dan perwakilan dari perusahaan NASA dan Hughes. 
Kejadian ini diresmikan juga melalui pidato kenegaraan oleh presiden Soeharto di Jakarta, tanggal 16 Agustus 1976. ini merupakan satu- satunya proyek teknologi yang mendapat tempat terhormat di gedung Parlemen. Namun peluncuran satelit itu merupakan kebijakan nasional yang gagasan awalnya dicetuskan oleh pemerintah. 
Hal ini didasarkan pada pertimbangan bahwa Indonesia pernah mengalami ancaman perpecahan. Untuk mempersatukan tanah air yang sangat luas ini diperlukan sarana perhubungan yang mencakup seluruh wilayah nusantara. Proses kelahiran satelit ini hanya melibatkan sedikit teknokrat dan teknolog yang berpihak pada kepentingan Orba.

Harapan Tentang Telematika di Indonesia

Perkembangan telematika di Indonesia sangat berkembang sangat pesat, walaupun mengalami pasang surut dalam memajukan telematika Indonesia. Ini semua sangat terlihat dalam perjalanan perkembangan telematika pada saat periode pra satellite yaitu bidang telepon dan radio. Karena adanya penyiaran kemerdekaan Indonesia, bangsa Indonesia hanya memakai alat seadanya untuk meyiarkan berita penting itu.
Terhambatnya perkembangan telematika di Indonesia juga di sebabkan oleh kurangnya minat pemerintah itu sendiri terhadap bidang telekomunikasi. Sehingga menyebabkan pendanaan di bidang telekomunikasi sangat sedikit. Tetapi banyak Negara-negara luar yang mau untuk menyumbangkan dana untuk pengembangan telekomunikasi Indonesia, karena Indonesia masih berkutat dengan teknologi sederhana dan “kuno” maka banyak Negara yang menghentikan dana pengembangan telekomunikasi untuk Indonesia.
Setelah radio perkembangan telematika di Indonesia selanjutnya adalah televisi. Siaran pertama kali terjadi pada 17 Agustus 1962 yang menyiarkan upacara peringatan kemerdekaan RI dari Istana Negara menggunakan microwave. Stasiun televisi pertama inilah yang sampai sekarang masih ada yaitu TVRI.
Selanjutnya diikuti dengan masa satelit. Yang pertama adalah satelit domestic palapa. Gagasan tentang peluncuran satelit bagi telekomunikasi domestik di Indonesia bisa ditelusuri asal muasalnya dari sebuah konferensi di Janewa tahun 1971 yang disebut WARCST (World Administrative Radio Confrence on Space Telecomunication). Keuntungan dari adanya satelit palapa ini adalah satelit memungkinkan penyebaran luas ideologi negara ke masyarakat luas melalui TV, satelit juga menguntungkan secara ekonomi. Satelit yang berikutnya adalah Nusantara 21, didirikannya satelit ini guna pengembangan telematika yang mencakup tiga hal yaitu infastruktur, aplikasi dan sumber daya.
Sekarang Indonesia sedang dalam masa era robotic. Dimana sedang di kembangkan untuk membuat robot yang sempurna yang bisa berperilaku seperti halnya manusia. Dan Indonesia pun sedang dalam pengembangan GPS ( Global Positioning System) yang bisa memberi petunjuk arah jalan untuk usernya.
Dengan adanya perkembangan telematika yang semakin cepat, banyak juga kendala-kendala yang dihadapi saat menggunakan telekomunikasi tersebut. Oleh karena itu terciptalah suatu arsitek yang bisa melindungi yang ada pada sisi klient dan server.
Untuk mendapatkan suatu hasil yang maksimal terbentuklah suatu kolaborasi antara arsitektur sisi computer dan arsitektur sisi klient, dengan adanya 3 model. Dibuat menjadi 3 model karena setiap model diperbaharui agar kelemahan-kelemahan yang ada pada model sebelumnya bisa diminilisasikan.
Perkembangan telematika tidak sampai sini saja, karena masih ada perkembangan wireless. Pada saat dahulu kita tidak bisa menggunakan koneksi internet tanpa menggunakan kabel, tapi jaman sekarang telah berkembang jaringan wireless. Semua dilakukan untuk mendapatkan kemudahan dalam menggunakan telekomunikasi. Untuk selanjutnya dibuat sebuah layanan context aware dan context event base. Yang digunakan untuk mengetahui berbagai konteks- konteks yang ada, yaitu sekumpulan parameter yang relevan dari pengguna (user) dan penggunaan network tersebut, serta memberikan layanan yang sesuai dengan parameter yang ada.

Sumber :http://id.wikipedia.org

http://zaenal-zaeblogs.blogspot.com
http://fadlyfattah.blogspot.com
READ MORE TELEMATIKA

Selasa, 16 Juli 2013

Tugas Ke-1 Bahasa indonesia

 

Rosa A. Sukamto, Dwi H. Widyantoro

Sekolah Teknik Elektro dan Informatika

Institut Teknologi Bandung, Bandung INDONESIA

rosa_if_itb_01@yahoo.com, dwi@if.itb.ac.id

Abstract

   Tulisan ini berisi hasil penelitian kami menggunakan pengurai Collins untuk menguraikan kalimat berbahasa Indonesia. Kami melakukan adaptasi pada semua file masukan pengurai Collins agar dapat digunakan untuk bahasa Indonesia. Pengurai Collins adalah pengurai yang dibuat untuk bahasa Inggris. Kumpulan file masukan pengurai Collins antara lain file leksikon, file grammar, file events, file simbol non terminal, dan file korpus.

 

   Kendala terbesar dari penelitian ini adalah tidak adanya treebank berbahasa Indonesia. Treebank digunakan untuk menghitung probabilitas grammar. Untuk menanggulanginya kita dapat melakukan translasi treebank berbahasa Inggris ke bahasa Indonesia atau membangun sebuah perkumpulan untuk membuat treebank berbahasa Indonesia secara manual.

 

1. Pendahuluan

     Pohon pola tata bahasa (parse tree) adalah pohon yang merepresentasikan struktur sintaks dari kalimat berdasarkan aturan grammar. Pohon pola tata bahasa sangat bermanfaat, misalnya untuk pemeriksaan tata bahasa (grammar checking) pada mesin pemrosesan kata (word processing system), mesin translasi, mesin penanya dan penjawab (question answering), pengekstrak informasi, aplikasi leksikografi, dan pengenalan ucapan (speech recognizers).

 

     Pohon pola tata bahasa dapat dibangkitkan secara otomatis dengan menggunakan pengurai (parser). Dengan memberikan aturan grammar yang benar maka sebuah pengurai (parser) akan dapat membangkitkan pohon pola tata bahasa yang benar. Beberapa penelitian telah mengembangkan berbagai algoritma penguraian dengan berbagai pendekatan. Pendekatan yang dilakukan bisa dengan pencarian berbasis hasil (goal-directed search) bersifat top-down atau pencarian berbasis data.(data-directed search) yang bersifat bottom-up. Pengurai yang sedang berkembang saat ini diantaranya adalah menggunakan pendekatan probabilistik.

 

  

     Pengurai Collins [6] merupakan pengurai dengan pendekatan probabilistik yang cukup populer saat ini. Meskipun sangat bermanfaat, tapi semua masukan dan penguraian dikemas untuk bahasa Inggris. Bahasa Indonesia memiliki kesamaan dan perbedaan dengan bahasa Inggris maka sangat memungkinkan menggunakan pengurai Collins untuk bahasa Indonesia.

2. Metodologi Penelitian

     Penelitian dalam penguraian dengan pendekatan probabilistik pada tulisan ini diawali dengan penelitian yang dilakukan oleh Schabes dan Water yang mendiskusikan Stochastic Lexicalized Context-Free Grammar (SLCFG) [11] yang juga dikenal sebagai Probabilistic Lexicalized Context-Free Grammar (PLCFG) yang merupakan model turunan dari Probabilistic Context-Free Grammar (PCFG). Glen Carol mengembangkan SINGER (Single Reader) yang menggunakan aturan sebagai masukan dan menggunakan PCFG untuk membangkitkan aturan yang baru. Mark Johnson melakukan penelitian dengan membandingkan PCFG dengan model lain untuk penguraian menggunakan pendekatan probabilistik. Penelitian tersebut menghasilkan bahwa performansi PCFG cukup bagus untuk berbagai kasus.

 

     Charniak [3, 4] membangun sebuah pengurai bottom-up untuk bahasa Inggris menggunakan treebank (kumpulan pohon kalimat) untuk menghitung probabilitas dari kalimat yang diuraikan. Berikutnya Charniak mengembangkan pengurai top-down yang menggunakan treebank dan pencarian entropi maksimum [5], mirip dengan menggunakan pohon keputusan. Collins membangun sebuah pengurai dengan pendekatan statistik dengan menghitung kebergantungan kata (bigram lexical), berikutnya Collins membangun sebuah pengurai berbasis headdriven (pencarian kepala kata pada setiap level pohon pola tata bahasa). Bikel mengembangkan model pengurai berbasis statistik (framework pengurai) dengan menggunakan parameter leksikal [2].

    

     Aziz berserta rekan-rekannya mencoba untuk menguraikan bahasa Melayu (Malaysia) menggunakan aturan produksi CFG. Walau kelihatan mirip, bahasa Indonesia dan bahasa Malaysia memiliki perbedaan sehingga hasil dari penelitian tersebut tidak dapat langsung diimplementasikan pada bahasa Indonesia. Lefuel dan Ross mencoba membuat pengurai dengan metode hibrid menggunakan pengurai dengan pendekatan statistik dan algoritma genetik [9]. Jurafsky dan Martin memberikan bahasan yang lebih mendalam mengenai penguraian dengan pendekatan probabilistik untuk bahasa Inggris.

 

   Collins memaparkan tiga buah model penguraian dengan pendekatan probabilistik. Pada model yang pertama, PCFG penggunakan aturan produksi berikut:

P(h) Ln(ln)...L1(l1)H(h)R1(r1)...Rm(rm)

   dimana H adalah kepala pada aturan P. Ln(ln)...L1(l1) serta R1(r1)...Rm(rm) adalah aturan sisi kiri dan aturan sisi kanan dilihat dari H. Collins memberikan parameter jarak (mempertimbangkan posisi simbol non terminal) sebagai pertimbangan pada model ini agar tidak terjadi dominasi sebagian aturan produksi.

 

     Model kedua merupakan lanjutan dari model pertama yang membedakan subkalimat yang berperan sebagai keterangan atau pelengkap (frase keterangan/frase pelengkap). Model ketiga memberikan penanganan terhadap kalimat  majemuk dan kalimat tanya Bagaimana perhitungan probabilitas untuk semua mode serta penjelasan lebih detail dapat dilihat pada disertasi Michael Collins [6].

     Pengurai Collins menggunakan PCFG untuk memodelkan pola tata bahasa dan menggunakan algoritma penguraian chart. Modul-modul pada pengurai Collins merupakan model-model pembelajaran.

 

  

   Menjalankan pengurai Collins untuk bahasa Indonesia membutuhkan adaptasi dari kumpulan file berikut:

 

                       File events untuk menyimpan events yang dibangkitkan secara heuristik (probabilitas kebergantungan elemen kalimat) dari WSJ (Wall Street Journal) Treebank menggunakan format Collins. File ini digunakan untuk menghitung probabilitas grammar (aturan produksi).

                       Sebuah korpus yang berisi kalimat-kalimat yang telah diberi tag, kalimat-kalimat inilah yang akan dijadikan pohon pola tata bahasa.

                       File yang berisi aturan grammar sebagai referensi penguraian.

                       File yang berisi simbol-simbol non terminal yang digunakan.

                       Sebuah leksikon untuk memeriksa tag kata

3. HASIL PENELITIAN DAN PEMBAHASAN

    Penyesuaian Pengurai Collins untuk Bahasa Indonesia

     Bagian ini akan membahas beberapa modifikasi yang diperlukan guna melakukan adaptasi kumpulan file masukan pengurai Collins untuk bahasa Indonesia sebagai pemrosesan awal (preprocessing).

 

1) File Event

   Collins membangkitkan events dari sebuah bagian di Penn WSJ treebank [10]. Bagian ini merupakan bagian yang rumit karena tidak adanya treebank berbahasa Indonesia. Hal tersebut akan didiskusikan pada Bab 6. Berikut adalah contoh sebagian dari file events berbahasa Indonesia:

 

 

2) File Korpus

   Kalimat yang akan diuraikan perlu diberi tag untuk setiap katanya (part of speech tagging). File korpus memiliki format sebagai berikut:

   jumlah_kata kata1 tag1 kata2 tag2 …

   seperti contoh berikut:

 

4 Yohanes NN memukul VB Bill NN . PU (hits)

 

   Gambar 1 merupakan langkah-langkah proses POS tagging yang digunakan pada penelitian ini. Pertama kata akan ditentukan tag-nya dengan melihat pada kamus. Jika kata masih belum dapat ditentukan tag-nya maka akan ditentukan dengan analisis morfologi. Jika kata masih belum dapat ditentukan tag-nya maka akan ditentukan dengan analisis bigram menggunakan aturan grammar yang ada, misalnya pada frase “sedang menggambar” dimana tag untuk “sedang” adalah RB dan tag untuk “menggambar” tidak diketahui maka jika ada aturan grammar VP RB VB dan setelah dihitung memiliki probabilitas yang terbesar maka dapat disimpulkan bahwa “menggambar” memiliki tag VB.

 

  Gambar 1. POS Tagging

 

   Bahasa Indonesia memiliki aturan morfologi yang dapat digunakan untuk memprediksi kelas kata atau tag kata. Tabel 1 merupakan beberapa aturan morfologi dalam bahasa Indonesia. Urutan proses prediksi tag kata dengan analisis morfologi adalah sebagai berikut:

                       Pemeriksaan kata bilangan; jika kata mengandung angka.

                       Pemeriksaan kata singkatan; jika semua huruf pada kata merupakan huruf besar; termasuk kata benda.

                       Pemeriksaan awalan, misalnya “menari” berasal dari kata dasar “tari” dengan awalan meN maka akan disimpulkan sebagai kata kerja,

                       Pemeriksaan akhiran, misalnya “terangi” berasal dari kata dasar “terang” mendapat akhiran –i yang berarti termasuk kata kerja,

                       Pemeriksaan konfiks (ada awalan dan akhiran),

                       Pemeriksaan pengulangan kata (baik pengulangan kata dasar atau pengulangan berimbuhan), misal “buku-buku” dimana termasuk kata benda (sama dengan jenis kata dasarnya),

                       Pemeriksaan nama; kata yang diawali dengan huruf besar yang berarti termasuk kata benda.

 

 

   Kami menggunakan 33 aturan prefiks/awalan, 29 aturan sufiks/akhiran, dan 17 konfiks untuk analisis morfologi.

 

3) Grammar dan Simbol Non-Terminal

      File grammar dibangkitkan dari treebank. Seperti halnya file events, disini juga ditemukan kendala yaitu tidak adanya treebank berbahasa Indonesia. Tata bahasa (grammar) pada bahasa Indonesia mirip dengan tata bahasa Inggris seperti adanya subyek-predikat-obyek, tapi tetap saja ada beberapa perbedaan antara bahasa Inggris dan bahasa Indonesia, misalnya kalimat berbahasa Indonesia tidak mengenal perbedaan kata kerja karena waktu kejadian. Bahasa Indonesia memiliki pola frase DM (diterangkan-menerangkan) misalnya buku biru, sedangakan bahasa Inggris memiliki pola frase MD (menerangkan diterangkan) misalnya blue book. Kata benda pada bahasa Indonesia juga tidak membedakan benda jamak dan tidak jamak.

 

   Aturan grammar pada pengurai Collins yang masih bisa digunakan untuk bahasa Indonesia juga kami gunakan sebagai aturan grammar untuk bahasa Indonesia. Contoh tata bahasa (grammar) untuk bahasa Indonesia adalah sebagai berikut:

 

  S NP VP NN

  NP NN JJ (misalnya: anak kecil)

  VP RB VB (misalnya: sedang menulis)

  

 

4) File Leksikon

   Pengurai Collins menggunakan file leksikon untuk memeriksa tag dari kata. Penelitian ini menggunakan KEBI (Kamus Elektronik Bahasa Indonesia) yang dapat digunakan untuk keperluan penelitian. KEBI dikembangkan oleh Badan Pengkajian dan Penerapan Teknologi (BPPT). KEBI berisi 29.396 kata. KEBI membagi kelas kata/jenis kata mejadi lima belas kelompok yaitu kata sifat (adjektiva), kata keterangan (adverbia), kata sandang (dibedakan menjadi determiner dan article), kata bantu (auxiliary), kata hubung (konjungsi), kata seru (interjeksi), kata benda (nomina), kata bilangan (dibedakan menjadi numeral dan ordinal), kata tugas partikel, kata fatis (kata yang menekankan seperti assalamualaikum, bismillah), kata depan (preposisi), kata ganti (pronomina), dan kata kerja (verba). Kamus tersebut masih harus dikonversikan menjadi format pengurai Collins.

 

Eksperimen    

   Eksperimen yang dilakukan bertujuan untuk memeriksa  apakah pengurai Collins dapat digunakanuntuk bahasa Indonesia menggunakan kumpulan file yang telah diadaptasi untuk bahasa Indonesia. Untuk eksperimen dibuat dua buah kelompok. Kelompok pertama terdiri dari 42 pohon kalimat pada treebank dan 7 kalimat sederhana untuk korpus. Pengurai Collins berhasil menguraikan semua kalimat pada kelompok pertama dengan enam kalimat diuraikan dengan benar dan satu kalimat diuraikan dengan kurang tepat. Kurang tepat karena aturan grammar yang tepat tidak ada dalam treebank yang digunakan. Gambar 2 merupakan salah satu hasil penguraian kalimat dari kelompok pertama.

 

 

4. Kesimpulan

   Secara teori sangat memungkinkan menggunakan pengurai Collins untuk bahasa Indonesia karena semua file masukan dapat diadaptasi ke bahasa Indonesia. Kendala terbesar dari penelitian ini adalah tidak adanya treebank untuk bahasa Indonesia sehingga hasil eksperimen awal kurang konsisten. Oleh karena itu sangat perlu dibuat treebank berbahasa Indonesia beserta korpus berbahasa Indonesia untuk memajukan penelitian di bidang bahasa Indonesia.

5. Referensi

                       Azis, Mohd Juzaiddin et al. (2006) Pola Grammar Technique for Grammatical Relation Extraction of Malay Language, Malaysian Journal of Computer Science, 19, 59-72

                       Bikel, Daniel M. (2004) : On The Parameter Space of Generative Lexicalized Statistical Parsing Models, Disertasi, University of Pennsylvania. 1-20, 141-148

                       Charniak, Eugene. (1993) : Statistical Language Learning, Massachusetts Institute of Technology.

                       Charniak, Eugene. (1997) : Statistical Parsing with a Context-free Grammar and Word Statistics, American Association for Artificial Intelligence: AAAI Press. 1-6

                       Charniak, Eugene. (2000) : A Maximum-Entropy-Inspired Parser, Proceedings of NAACL-2000. 132-139.

                       Collins, Michael. (1999) : Head-Driven Statistical Models for Natural Language Parsing, Disertasi program Doctor of Philosophy, University of Pennsylvania. 1-265.

                       Collins, Michael, Jan Hajic, Lance Ramshaw, Cristoph Tillmann (1999) : A Statistical Parser for Czech, Proceedings of the 37th Annual Meeting of the ACL.

                       Gusmita, Ria Hari & Ruli Manurung (2008) Some initial experiments with Indonesian probabilistic parsing. Second MALINDO Workshop. 1-5.

                       Lefuel, Ramon & Brian J. Ross (2004) Parsing Probabilistic Context Free Language with Multiple-Objective Genetic Algorithm, Technical Report, Brock University. 1-11.

                       Marcus, Mitchell P. dkk (1992) : Building a Large Annotated Corpus of English: The Penn Treebank. Departmet of Computer and Information Science University of Pennsylvania.

                       Schabes, Yves & Waters, Richard C (1993) Stochastic Lexicalized Context-Free Grammar, International Workshop on Parsing Technology. 1-10.

READ MORE Tugas Ke-1 Bahasa indonesia