Iseng, kali ini menapaki tahun baru 2019, mencoba kembali fokus bermain pada pengolahan data sembari mengerjakan tugas-tugas lainnya yang tak kalah menantang (ngurusin orang).
Sudah cukup lama pengen mencoba fitur word cloud, sehingga bisa tau kata-kata apa saja yang cenderung lebih banyak terucap, sehingga secara kasar kita bisa mengerti arah fokus ucapan seseorang.
Kali ini saya mencoba membuat sebuah word cloud dari pidato kenegaraan Presiden RI pada tahun 2017 dan 2018 (dengan pejabat Presiden yang sama, akan lebih menarik jika dibandingkan dengan pejabat Presiden yang berbeda, karena biasanya juru bahasanya beda hehehe....)
Software yang akan saya gunakan adalah Orange Data Mining, kenapa saya pakai ini karena gratis dan basis-nya adalah Python (dari kuliah sudah jatuh cinta pada bahasa satu ini). Tentunya ada fasilitas untuk Textminingnya, karena tujuannya adalah visual programming jadi gak perlu repor-repot coding lagi (ya dunia sudah berkembang semakin cepat, dan semua orang butuh cepat).
Langsung saja, berikut adalah visualisasi canvas Orang yang saya buat, tentunya data teks atau naskah pidatonya juga sudah saya dapatkan.
Corpus 2017 berisikan text pidato tahun 2017 dan 2018 adalah pidato tahun 2018, selanjutnya dilakukan pemrosesan text, seperti menghilangkan tanda baca, kata-kata hubung, sehingga didaptkan kata-kata yang benar-benar menjadi fokus. Hasilnya adalah :
Pidato Presiden tahun 2017 :
Hasilnya menunjukkan kata-kata yang menjadi fokus adalah : indonesia, rakyat, pemerintah, bangsa, negara, dan pembangunan (> 26 kali pengucapan)
Pidato Presiden tahun 2018 :
Hasilnya menunjukkan kata-kata yang menjadi fokus adalah : indonesia, bangsa, negara, pemerintah, rakyat (> 24 kali pengucapan) dan dengan penakanan yang cukup banyak terhadap kata-kata indonesia (96 kali pengucapan)
Nah kata-kata inilah yang paling sering di ucapkan oleh Presiden saat pidato, tapi apakah kita sudah mendapatkan esensi dari Pidato ini ? Tentu belum karena kata-kata ini adalah kata-kata yang sangat umum, sehingga bisa jadi seharusnya kata-kata ini di filter sehingga muncul kata-kata yang benar-benar menjadi fokus, ini akan saya bahas di tulisan selanjutnya, tulisan kali ini baru menunjukkan kemampuan dari Orange untuk melakukan pengolahan Teks.
Sudah cukup lama pengen mencoba fitur word cloud, sehingga bisa tau kata-kata apa saja yang cenderung lebih banyak terucap, sehingga secara kasar kita bisa mengerti arah fokus ucapan seseorang.
Kali ini saya mencoba membuat sebuah word cloud dari pidato kenegaraan Presiden RI pada tahun 2017 dan 2018 (dengan pejabat Presiden yang sama, akan lebih menarik jika dibandingkan dengan pejabat Presiden yang berbeda, karena biasanya juru bahasanya beda hehehe....)
Software yang akan saya gunakan adalah Orange Data Mining, kenapa saya pakai ini karena gratis dan basis-nya adalah Python (dari kuliah sudah jatuh cinta pada bahasa satu ini). Tentunya ada fasilitas untuk Textminingnya, karena tujuannya adalah visual programming jadi gak perlu repor-repot coding lagi (ya dunia sudah berkembang semakin cepat, dan semua orang butuh cepat).
Langsung saja, berikut adalah visualisasi canvas Orang yang saya buat, tentunya data teks atau naskah pidatonya juga sudah saya dapatkan.
Corpus 2017 berisikan text pidato tahun 2017 dan 2018 adalah pidato tahun 2018, selanjutnya dilakukan pemrosesan text, seperti menghilangkan tanda baca, kata-kata hubung, sehingga didaptkan kata-kata yang benar-benar menjadi fokus. Hasilnya adalah :
Pidato Presiden tahun 2017 :
Hasilnya menunjukkan kata-kata yang menjadi fokus adalah : indonesia, rakyat, pemerintah, bangsa, negara, dan pembangunan (> 26 kali pengucapan)
Pidato Presiden tahun 2018 :
Hasilnya menunjukkan kata-kata yang menjadi fokus adalah : indonesia, bangsa, negara, pemerintah, rakyat (> 24 kali pengucapan) dan dengan penakanan yang cukup banyak terhadap kata-kata indonesia (96 kali pengucapan)
Nah kata-kata inilah yang paling sering di ucapkan oleh Presiden saat pidato, tapi apakah kita sudah mendapatkan esensi dari Pidato ini ? Tentu belum karena kata-kata ini adalah kata-kata yang sangat umum, sehingga bisa jadi seharusnya kata-kata ini di filter sehingga muncul kata-kata yang benar-benar menjadi fokus, ini akan saya bahas di tulisan selanjutnya, tulisan kali ini baru menunjukkan kemampuan dari Orange untuk melakukan pengolahan Teks.
Word Cloud : Pidato Kenegaraan Presiden RI Tahun 2017 dan Tahun 2018
Reviewed by Ade
on
10.06
Rating: