Saturday, March 4, 2017

Teknik Evaluasi pada Human Computer Interaction



Evaluasi


  •     Tes kegunaan dan fungsi dari sistem
  •     Terjadi di laboratorium, lapangan dan / atau bekerjasama dengan pengguna
  •     Mengevaluasi kedua desain dan implementasi
  •     Harus dipertimbangkan pada semua tahap dalam siklus hidup desain
Evaluasi merupakan tes atas tingkat penggunaan dan fungsionalitas sistem. Evaluasi dilakukan untuk memastikan kecocokan dengan permintaan pengguna/tujuan pengguna dan untuk melihat apakah hasil rancangan dengan proses uji coba system yang telah dibuat sesuai dengan user. Proses evaluasi ini dikerjakan dalam satu fase proses perancangan tetapi melalui perancangan dengan prinsip life cycle dengan hasil dikembalikan untuk memodifikasi perancangan.



Tujuan Adanya Evaluasi Yaitu :

·         Melihat seberapa jauh sistem berfungsi. Desain sistem memungkinkan user melakukan tugas dengan lebih mudah. Desain tidak hanya membuat fungsionalitas yang sesuai dengan yang ada dalam sistem, tetapi juga memberikan kemudahan pada user untuk dapat melakukan aksi. Evaluasi pada tahap ini meliputi pengukuran unjuk kerja dari user untuk melihat keefektifan sistem dalam mendukung tugas.

·         Melihat efek interface bagi pengguna. Kemudahan untuk mempelajari sistem, usability dan perilaku user.

·         Mengidentifikasi problem khusus yang terjadi pada sistem, misalnya : ketika menggunakan konteks yang diinginkan tapi hasilnya tidak sesuai atau terjadi kekacauan diantara user. Ini tentunya berhubungan dengan usability dan fungsionalitas dari sistem (bergantung dari sebab masalah).

Jenis Evaluasi Dibedakan Menjadi 2 Yaitu :

·         Summative evaluation.
Evaluasi yang dilakukan untuk menguji kesuksesan suatu produk yang sudah selesai yaitu mencapai standar yang ditentukan sebelumnya (ISO).

·         Formative evaluation.
Evaluasi yang dilakukan selama desain untuk memastikan produk sesuai dengan yang diinginkan pengguna.
Tempat untuk melakukan evaluasi dilakukan di laboratorium dan di lapangan/ lokasi kerja pengguna sistem. Waktu evaluasi dilakukan ketika muncul produk baru atau perbaikan dari produk sebelumnya.


Mengevaluasi Perancangan

Evaluasi ini terjadi setelah proses perancangan. Secara ideal, evaluasi pertama dilakukan sebelum implementasi dimulai. Jika perancangan dievaluasi, kesalahan dapat dihindari karena perancangan dapat diperbaiki sebelumnya.

1.      Cognitive Walkthrough
Tujuan evaluasi ini untuk melihat seberapa besar dukungan yang diberikan pada pengguna untuk mempelajari beberapa tugas yang diberikan. Pendekatan ini dikemukakan oleh Polson, dkk. Walkthrough dilaksanakan oleh perancang atau seorang ahli dalam psikologi kognitif. Ahli bekerja melalui perancangan tugas tertentu, tahap demi tahap, mengidentifikasi masalah yang berpotensi pada kriteria psikologi. Kemudian dibandingkan ke proses dimana perancang software bekerja dengan koding pada kondisi yang berbeda.
Dalam pendekatan ini ada beberapa issue yang timbul yaitu :
·         Pengaruh apa yang timbul setelah tugas ini diberikan ke pengguna?
·         Proses cognitive apa yang tersedia?
·         Masalah pembelajaran apa yang seharusnya timbul?

Analisis difokuskan pada tujuan user dan pengetahuan. Untuk melakukan evaluasi cognitive walkthrough membutuhkan informasi sebagai berikut :
·         Deskripsi dari suatu interface yang dibutuhkan itu sendiri
·         Deskripsi dari tugas termasuk usaha yang benar untuk melakukannya dan struktur tujuan untuk mendukungnya.
Dengan informasi yang sudah didapatkan maka evaluator dapat melakukan langkah dari walkthrough yaitu :
·         Pilih tugas
·         Deskripsikan tujuan awal dari user
·         Lakukan kegiatan/aksi yang tepat
·         Analisa proses keputusan untuk setiap kegiatan
Cognitive walkthrough berbasis formulir yang disediakan untuk merujuk evaluator melalui sekumpulan pertanyaan yang berhubungan dengan tugas dan tujuan user.

2.      Heuristic Evaluation
Dikemukan oleh Neilsen dan Molich, hampir sama dengan cognitive walkthrough tetapi sedikit terarah dan terstruktur. Pada evaluasi ini, sekumpulan kriteria usability atau heuristic diidentifikasi dan perancangan dilaksanakan. Dalam sistem ini terdapat beberapa kriteria yaitu :
·         Perilaku sistem dapat dipastikan
·         Perilaku sistem konsisten
·         Feedback tersedia
·         Kemampuan memori user tidak melebihi batas
·         Dialog merupakan orientasi tugas
Tujuan heuristic evaluation adalah untuk memperbaiki rancangan secara efektif. Evaluator melakukan evaluasi melalui kinerja dari serangkaian tugas dengan perancangan dan disesuaikan dengan kriteria setiap tingkatan. Jika kesalahan terdeteksi dapat ditinjau ulang untuk diperbaiki sebelum tahap implementasi. Pendekatan ini tidak seluruhnya subyektif dengan menggunakan kriteria khusus untuk merujuk evaluasi. Selain itu membutuhkan level pengetahuan tertentu untuk mengaplikasikan evaluasi ini. Misalnya untuk menentukan jika suatu perancangan melebihi memori user, perancang perlu mengetahui kemampuan memori manusia.

3.      Review Based Evaluation
Evaluasi antara psikologi eksperimen dengan interaksi manusia dan komputer menghasilkan hasil-hasil eksperimen yang baik dan pengalaman yang nyata. Misalnya pada usability dari tipe menu yang berbeda, pemanggilan nama perintah dan pemilihan icon. Dalam kenyataannya, hasil eksperimen ini tidak dapat dipastikan mempertahankan keadaan yang tetap. Evaluator harus memilih data secara hati-hati, menunjuk rancangan eksperimen yang dipilih, subyek masyarakat yang digunakan, analisa pelaksanaan dan asumsi yang dibuat. Misalnya: pengujian eksperimen, usability dari jenis sistem ‘bantu’ umum yang menggunakan subyek baru tidak menyediakan evaluasi yang tepat dari sistem ‘bantu’ yang dirancang bagi user ahli.

4.      Model Based Evaluation
Pendekatan evaluasi ini berguna untuk mengevaluasi perancangan dengan kombinasi spesifikasi perancangan dan evaluasi ke dalam kerangka kerja yang sama. Contohnya: GOMS Model, Keystroke level model dan design rationale.

Mengevaluasi Melalui Partisipasi Pengguna

Laboratory studies
ü  Keuntungan :
®    Peralatan special tersedia.
®    Lingkungan yang terinterupsi.
ü  Kerugian :
®    Kurangnya konteks.
®    Sulit untuk mengamati beberapa pengguna bekerja sama.
ü  Kelayakan :
®    Jika lokasi sistem berbahaya atau tidak praktis untuk terkendala sistem single user untuk memungkinkan manipulasi dikendalikan penggunaan.
Field Studies
ü  Keuntungan :
®    Lingkungan alami.
®    Konteks dipertahankan (meskipun pengamatan dapat mengubah itu).
®    Studi longitudinal mungkin.

ü  Kekurangan :
®    Gangguan.
®    Kebisingan.

ü  Kelayakan :
®    Di mana konteks sangat penting untuk studi longitudinal.

Mengevaluasi Implementasi

Evaluasi Eksperimen
·         Evaluasi dikendalikan dari aspek-aspek tertentu dari perilaku interaktif
·         Evaluator memilih hipotesis yang akan diuji
·         Sejumlah kondisi eksperimental dianggap yang hanya berbeda dalam nilai dari beberapa variabel yang dikendalikan.
·         Perubahan dalam ukuran perilaku yang dikaitkan dengan kondisi yang berbeda
Evaluasi eksperimen merupakan evaluasi dengan pendekatan statistik dengan memilih hipotesis yang akan dicoba dan jumlah kondisi eksperimen. Setiap eksperimen memiliki dasar yang sama. Evaluator memilih hipotesa untuk diuji yang dapat ditentukan dengan mengukur beberapa atribut dari perilaku subyek. Sejumlah kondisi eksperimen ditentukan yang berbeda dalam hal nilai dari variabel tetap yang terkontrol. Setiap perubahan pengukuran perilaku diatributkan ke kondisi yang berbeda.

Faktor-faktor yang perlu dipertimbangkan dalam mendukung evaluasi eksperimen yaitu :
Ø  Subjek, siapa yang merepresentasikan.
v  Eksperimen sampai sesuai dengan keinginan user
v  User yang dipilih sesuai dengan kelompok user yang dimaksud baik usia maupun tingkat pendidikannya jika subjek bukan user sebenarnya.

Ø  Variabel, sesuatu untuk dimodifikasi dan ukuran
v  Variabel independen, eksperimen untuk menghasilkan kondisi yang berbeda seperti: jenis interface, level dari help, jumlah item menu dan perancangan ikon.
v  Variabel dependen, variabel yang dapat diukur dalam eksperimen seperti: waktu untuk menyelesaikan tugas, jumlah kesalahan yang dibuat dan kualitas dari unjuk kerja user.

Ø  Hipotesis, apa yang ingin ditunjukkan.
v  Merupakan prediksi yang dihasilkan dalam eksperimen.
v  Hipotesis ini menggunakan variabel independen dan dependen, dimana variasi dalam variabel independen akan menyebabkan perbedaan pada variabel dependen.
v  Tujuan eksperimen adalah untuk menyangkal keberadaan null hypothesis yang menyatakan tidak ada perbedaan dalam variabel dependen diantara tingkatan dari variabel independen.
v  Pengukuran statistika menunjukkan bahwa nilai hasil dapat dibandingkan dengan tingkat kepercayaan. Jika nilai tertentu ada pada tingkat kepercayaan, hipotesis null tidak ada.

Ø  Desain eksperimental, bagaimana cara melakukannya. Dalam perancangan eksperimen terdiri dari :
1. Between-Groups (Randomized)
·         Masing-masing subyek diberikan kondisi yang berbeda yakni kondisi eksperimen dan control.
·         Keuntungan perancangan ini adalah setiap user menghasilkan satu kondisi
·         Kerugiannya adalah dengan semakin banyak jumlah subyek yang tersedia akan menyebabkan hasilnya akan berkurang dan perbedaan antar setiap individu akan membuat bias hasil. Hal ini dapat diatasi dengan memilih dengan hati-hati subyek yang dipilih dan menjamin setiap kelompok di masyarakat terwakili.
2. Within-Groups
·         Setiap user akan menampilkan kondisi yang berbeda
·         Jumlah user yang tersedia lebih sedikit
·         Pengaruh dari subyek lebih sedikit
Pengukuran statistik
·         Dua aturan dalam analisa dengan statistic yaitu : melihat dan menyimpan data.
·         Variabel yang digunakan yaitu :
v  Discrete Variables
Ø  Menggunakan jumlah yang terbatas dari suau nilai atau tingkatan, contoh : warna layar monitor yaitu red. green, dan blue
Ø  Merupakan suatu variabel independen
v  Continous Variable
Ø  Menggunakan jumlah berapapun, contoh : tinggi seseorang atau waktu yang diperlukan untuk menyelesaikan suatu pekerjaan
Ø  Merupakan variabel dependen

Contoh Mengevaluasi Perancangan Icon :
Dimisalkan kita akan membuat paket pengolahan kata baru yang menggunakan icon untuk presentasinya. Ada 2 jenis perancangan icon akan digunakan yang paling mudah bagi user. Jenis pertama menggunakan gambar natural (berdasarkan metapora dari dokumen kertas), jenis yang lain menggunakan gambar abstrak seperti terlihat pada gambar di atas. Yang pertama harus dilakukan adalah membentuk hipotesis : tampilan yang seperti apa yang diinginkan? Pada kasus ini kebanyakan user akan mengambil gambar natural sebagai icon yang lebih mudah dalam pemanggilan, karena lebih familiar bagi user.
Hipotesis ini mengidentifikasikan variabel independent untuk eksperimen, natural dan abstrak. Pada pertimbangan variabel dependent, pengukuran ”lebih mudah” dilihat dari jumlah kesalahan dalam memilih dan waktu yang digunakan untuk memilih sebuah icon. Kontrol ekperimen dilakukan dengan membuat interface yang identik dengan perancangan icon dan tugas pemilihan dibuat yang dapat diulang untuk setiap kondisi. Kemudian metode eksperimen dilakukan dengan menggunakan kelompok user yang dimaksud. Mengingat pembelajaran terlibat dalam eksperimen ini, maka perancangan within-groups digunakan dimana setiap user menggunakan kedua set icon tersebut. Kemudian hasil eksperimen secara detail dianalisis.

Teknik Observasi

Fungsi perangkat lunak yang digunakan pada teknik observasi yaitu :
·         Untuk memonitor test
·         Membuat catatan kejadian penting yang diobservasi dari video proses testing
·         Membantu membuat umpan balik diagnostic mengenai masalah penggunaan sistem.

Jenis-Jenis Teknik Observasi Yaitu :
v  Think Aloud.
Cara yang popular dalam mengumpulkan informasi dengan melihat interaksi user. Evaluator melihat dan merekam aksi user (dengan berbagai teknik).Konsekuensinya user ditanyai untuk mengelaborasikan aksinya dengan ”thinking aloud”, yaitu menjelaskan : apa yang mereka percaya terjadi, mengapa mereka mengambil tindakan, apa yang mereka coba kerjakan. Think aloud mempunyai keuntungan yakni sederhana, membutuhkan sedikit pengetahuan untuk menampilkannya dan menyediakan pengertian yang berguna dengan interface juga dapat digunakan untuk mengobservasi bagaimana sistem digunakan. Variasi lain adalah cooperative evaluation dimana:
§  Proses mempunyai hambatan yang sedikit sehingga lebih mudah dipelajari oleh orang yang melakukan evaluasi.
§  User mempunyai dorongan untuk menguji sistem
§  Orang yang melakukan evaluasi dapat menjelaskan kekacauan yang terjadi dan memaksimalkan pendekatan yang efektif untuk mengenali masalah

v  Cooperative evaluation
§  Variasi berpikir keras
§  Pengguna bekerja sama dalam evaluasi
§  Baik pengguna dan evaluator dapat saling bertanya di seluruh        
ü Keuntungan tambahan
§   Kurang dibatasi dan lebih mudah digunakan
§   Pengguna dianjurkan untuk mengkritik sistem
§   Klarifikasi mungkin

v  Analisa Protokol.
Terdapat beberapa metode untuk merekam kegiatan user :
§  Kertas dan pensil - murah, terbatas pada kecepatan penulisan
§  Audio - baik untuk berpikir keras, sulit untuk mencocokkan dengan protokol lain
§  Video - akurat dan realistis, perlu peralatan khusus, menonjol
§  Komputer logging - otomatis dan tidak mengganggu, sejumlah besar data yang sulit untuk menganalisis
§  Notebook user - kasar dan subjektif, wawasan yang berguna, baik untuk studi longitudinal

§  Penggunaan campuran dalam praktek.
§  Audio / video transkripsi sulit dan membutuhkan keterampilan.
§  Beberapa alat pendukung otomatis tersedia

v  Automatic protocol analysis tools
EVA (Experimental Video Annotator) Sistem prototipe yang berjalan pada multi-media workstation yang dihubungkan langsung ke video recorder. Evaluator dapat menemukan sekumpulan tombol yang mengindikasikan event yang berbeda. Tombol digunakan dalam sesi perekaman untuk mencatat video dengan notes. Selama sesi user bekerja pada workstation dan direkam menggunakan video, logging system dan audio. Evaluator menggunakan tombol untuk mencatat event yang penting dari user dan merekam notes tambahan pada editor teks. Setelah sesi evaluator dapat menanyakan dan menggunakannya untuk mencari informasi. Contoh : Workplace project pada Xerox PARC.
Keuntungan
v Analis memiliki waktu untuk fokus pada insiden yang relevan
v Menghindari gangguan berlebihan tugas
Kekurangan
v Kurangnya kesegaran
v Mungkin interpretasi pasca-hoc peristiwa

v  Post-task walkthroughs
Terdapat beberapa keadaan yang menyebabkan subyek tidak dapat berbicara selama observasi sebenarnya seperti subyek sedang mengerjakan tugas yang sangat penting dan banyak. Pada keadaan ini post-task walkthroughs dapat melihat secara subyektif perilaku user.


Teknik Query

·        Wawancara/Interview.
Wawancara merupakan suatu teknik yang dilakukan dengan menanyai user satu demi satu. Wawancara user mengenai pengalaman mereka dengan sistem interaktif yang menyediakan informasi secara langsung dan terstruktur. Wawancara efektif pada evaluasi tingkat tinggi, khususnya dalam memperoleh informasi tentang preferensi user, impresi dan perilaku. Jika digunakan bersama observasi, berarti mencari klarifikasi sebuah kejadian. Keunggulan metode ini pertanyaan yang diberikan dapat divariasikan sesuai dengan konteksnya dan pandangan user dapat diperoleh. Agar lebih efektif wawancara perlu direncanakan dan dibuat pertanyaannya. Kekurangan metode ini sangat subjektif dan memakan waktu yang lama.


Keuntungan
§  Dapat bervariasi sesuai konteks
§  Masalah dapat dieksplorasi lebih lengkap
§  Dapat menimbulkan pandangan pengguna dan mengidentifikasi masalah tak terduga
Kekurangan
§  Sangat subjektif
§  Memakan waktu

·        Kuesioner
Kuesioner merupakan suatu teknik dengan memberikan sejumlah pertanyaan yang sudah pasti diberikan dan dalam bentuk tercetak. Pertama yang harus dilakukan evaluator adalah menentukan tujuan dari kuesioner : informasi apa yang akan diambil ? Keunggulan metode ini yaitu cepat, dapat mencapai sasaran untuk kemompok pengguna yang besar dan dapat dianalisis dengan teliti, sedangkan kekurangannya kurang fleksibel.
Beberapa jenis kuesioner yaitu :
§  General, pertanyaan untuk mengetahui latar belakang pengguna dan memasukkanya ke dalam subyek populasi.
§  Open-ended, pertanyaan yang membutuhkan jawaban dan opini sendiri yang berguna untuk mengumpulkan informasi subyektif secara umum tetapi sulit untuk dianalisis.
§  Scalar, user diminta untuk memutuskan pernyataan tertentu berdasarkan skala angka, biasanya berhubungan dengan setuju atau tidak setuju terhadap pernyataan yang diberikan. Contoh : tidak setuju 1 2 3 4 5 setuju
§  Multi-choice, responden diberikan pilihan respon secara eksplisit dan hanya boleh memilih satu saja atau sebanyak yang diperlukan. Misal : Software apa yang pernah Anda gunakan ?
§  Ranked, mengurutkan item dalam daftar dan berguna untuk mengindikasikan preferensi user. Misal : rangkinglah kegunaan dari metode perintah
Tipe-tipe pertanyaan ini sangat berguna untuk tujuan yang berbeda-beda. Untuk mengurangi kesalahan dari responden, sebaiknya menggunakan pertanyaan tertutup seperti scalar, ranked atau multi-choice.


Pendekatan Evaluasi

Pendekatan evaluasi dibedakan menjadi 3 yaitu :
Ø  Usability testing
§  Memastikan konsistensi struktur navigasi, penggunaan istilah, dan bagaimana sistem merespon pengguna
§  Mengukur kinerja pengguna untuk menyelesaikan tugas tertentu
§  Metode:
§  Mengamati pengguna menggunakan sistem dan merekam kesalahan, waktu
§  Interview/kuesioner untuk mendapatkan pendapat pengguna
§  Dilakukan di laboratorium
§  Contoh aplikasi : wordprocessor, spreadsheet, database.

Ø  Field study
§  Memahami apa yang dilakukan pengguna dan bagaimana produk terlibat/berperan dalam kegiatan mereka
§  Identifikasi kesempatan adanya teknologi baru
§  Membangun kebutuhan desain
§  Memfasilitasi pengenalan teknologi baru atau meluncurkan teknologi dalam konteks yang berbeda
§  Evaluasi teknologi
§  Metode : interview dan observasi

Ø  Analytical Evaluation

Ø  Evaluasi tanpa melibatkan end-user
Metode:
§  Inspeksi → heuristic evaluation, menggunakan standar untuk identifikasi masalah usability
§  Walkthrough, melibatkan ahli untuk menjalankan skenario pada prototype aplikasi, dan menggunakan simulasi penyelesaian masalah.

Metode Fisiologis

Ø  Pelacakan Mata
§  Kepala atau meja dipasang peralatan melacak posisi mata
§  Gerakan mata mencerminkan jumlah pengolahan kognitif display
membutuhkan
§  Pengukuran mencakup
ü  Fiksasi : mata mempertahankan posisi stabil. Jumlah dan durasi menunjukkan tingkat kesulitan dengan tampilan
ü  Saccades : gerakan mata yang cepat dari satu tempat tujuan yang lain
ü  Memindai jalur : bergerak langsung ke target dengan fiksasi pendek di target optimal
Ø  Pengukuran Fisiologis
§  Respons emosional terkait dengan perubahan fisik
§  Ini dapat membantu menentukan reaksi pengguna ke sebuah antarmuka
§  Pengukuran mencakup:
ü  Aktivitas jantung, termasuk tekanan darah, volume dan denyut nadi.
ü  Aktivitas kelenjar keringat: galvanic skin response (gsr)
ü  Aktivitas listrik di otot: electromyogram (emg)
ü  Aktivitas listrik di otak: electroencephalogram (eeg)
§  Beberapa kesulitan dalam menafsirkan ini respon fisiologis - penelitian lebih lanjut diperlukan

Memilih Metode Evaluasi

Ada 7 faktor yang membedakan teknik evaluasi yang berbeda yang membantu kita dalam memilih teknik evaluasi yang sesuai yaitu :
Ø  Tingkat Siklus
Desain VS Implementasi
Evaluasi pada tingkatan perancangan hanya membutuhkan ahlinya dan akan dianalisa sedangkan evaluasi pada tingkat implementasi membawa user sebagai subyek dari eksperimen.
Laboratory VS Field studies
Secara ideal proses perancangan mencakup dua jenis evaluasi ini dimana pada laboratorium merupakan awal tingkatan sedangkan field studies ditempatkan pada tingkatan implementasi.
Ø  Tingkat Obyektivitas Dan Subyektivitas
Subyektif VS. Obyektif
Pada teknik yang subyektif seperti pada cognitive walkthrough maupun think aloud mempercayakan pada evaluator atau orang yang melakukan evaluasi. Hal ini dapat menyebabkan penilaian evaluator menjadi bias sehingga diperlukan lebih dari satu orang evaluator. Sedangkan teknik obyektif seharusnya menghasilkan hasil yang berulang yang tidak tergantung pada evaluator. Eksperimen yang terkontrol merupakan contoh pengukuran obyektif. Secara ideal pengukuran secara subyektif dan obyektif seharusnya digunakan keduanya.
Ø  Jenis Ukuran Yang Tersedia
Qualitative VS Quantitative measures
Pengukuran menggunakan numerik lebih mudah digunakan teknik statistic sedangkan non-numerik lebih sulit dilakukan akan tetapi menghasilkan sesuatu yang penting secara lengkap yang tidak dapat dilakukan secara numerik.
Ø  Informasi Yang Tersedia
Tingkatan informasi yang tersedia untuk evaluator pada setiap tingkat proses perancangan dimulai pada informasi yang rendah sampai dengan tingkatan yang tinggi.
Ø  Kesiapan Dari Suatu Respon
Faktor lain yang membedakan teknik evaluasi adalah kesiapan mengambil tindakan yang tersedia. Seperti metode think aloud yang merekam perilaku user pada waktu interaksi. Sedangkan post task walkthrough mempercayakan pada pengumpulan kembali kegiatan user.
Ø  Tingkat Gangguan Yang Tidak Secara Langsung
Intrusiveness. Merupakan teknik yang menghasilkan pengukuran segera yang dihasilkan user selama interaksi dan mempunyai resiko mempengaruhi perilaku user. Evaluator harus sensitif untuk mengurangi masalah ini tetapi tidak dapat megubah semuanya.
Ø  Sumber Yang Tersedia

Hal terakhir yang perlu diperhatikan dalam memilih teknik evaluasi yakni: peralatan, waktu, biaya, subyek serta evaluator yang ahli.

0 komentar:

Post a Comment