Abstrak - Jadwal kegiatan akademik merupakan pegangan penyelenggaraan administrasi pendidikan dan... more Abstrak - Jadwal kegiatan akademik merupakan pegangan penyelenggaraan administrasi pendidikan dan pengajaran, sehingga kegiatan dapat terlaksana sesuai dengan siklus semesteran atau tahunan yang mengacu pada kalender akademik dibawah ketetapan Rektor perguruan tinggi. Jadwal kegiatan akademik pada Program Studi Teknik Informatika Universitas Tanjungpura saat ini masih menggunakan media sosial dan papan pengumuman serta belum ada publikasi mengenai jadwal seminar dan sidang mahasiswa. Hal ini berdampak pada kurangnya informasi bagi mahasiswa yang ingin mendaftar menjadi peserta sidang dan seminar serta membuat lambatnya penyampaian informasi jika jadwal baru tersedia. Pada penelitian ini, dibuat aplikasi berbasis Android yang dapat membantu mahasiswa untuk mendapatkan informasi jadwal akademik dimana saja dan kapan saja selama terkoneksi dengan internet. Aplikasi ini juga dilengkapi dengan fitur push notification yang akan mengirimkan pesan kepada pengguna jika jadwal baru tersedia s...
Fungsi geotagging pada smartphone dapat dioptimalkan pemanfaatan dengan mengembangkan sistem pela... more Fungsi geotagging pada smartphone dapat dioptimalkan pemanfaatan dengan mengembangkan sistem pelaporan masyarakat terkait masalah pembangunan infrastruktur dan pelayanan publik. Masyarakat dapat berpartisipasi dengan cara mengirimkan foto yang mempunyai informasi geotagging terkait dengan masalah yang ada disekitarnya. Suatu sistem yang dirancang dan dikembangkan mampu mengolah informasi geotagging pada foto yang dimana hasil ekstraksinya akan diperoleh lokasi yang dilaporkan masyarakat dalam bentuk informasi koordinat lintang dan bujur yang selanjutnya disimpan dalam database dan dapat ditampilkan sebagai marker atau titik poin dalam peta ( map). Dengan menampilkan informasi lokasi tersebut, pemerintah atau instansi terkait dapat mengetahui lokasi laporan masyarakat tersebut, memantau persebaran daerah masalah, merencanakan dan mengambil tindakan penanggulangan secara cepat dan tepat, khususnya bagi daerah masalah yang jauh dari perhatian pemerintah.
Dalam bidang pengolahan bahasa alami dan sistem temu balik informasi, representasi sebuah data te... more Dalam bidang pengolahan bahasa alami dan sistem temu balik informasi, representasi sebuah data teks sangat penting untuk mendukung proses analisis data statistik di dalamnya. Data teks dengan bentuk tidak terstruktur dapat direpresentasikan secara sederhana menggunakan sekumpulan set kata yang disebut bag-of-words dan belum memiliki label atau kelas tertentu. Data unsupervised atau objek-objek yang belum memiliki label dapat dikelompokan menggunakan klustering berdasarkan kemiripan satu objek dengan objek lain. Artikel ini membahas perbandingan hasil pengelompokan unsupervised data menggunakan algoritma kluster yang tersedia pada tools Weka, yaitu SimpleKMeans, X-Means, dan Farthest First. SimpleKMeans dan XMeans digunakan untuk mengolah dataset dan mengelompokan berdasarkan jumlah kluster tetap yang digunakan, sedangkan Farthest First akan meletakan semua pusat kluster pada titik terjauh dari pusat kluster yang sudah ada untuk mengelompokan data. Dataset berasal dari UCI machine le...
Communications in Computer and Information Science, 2015
The accesible loose information through the Internet leads to plagiarism activities use the copy-... more The accesible loose information through the Internet leads to plagiarism activities use the copy-paste-modify practice is growing rapidly. There have been so many methods, algorithm, and even softwares that developed till this day to avoid and detect the plagiarism which can be used broadly unlimited on a certain subject. Research about detection of plagiarism in Indonesian Language develop day by day, although not significant as English Language. This paper proposes several models of distance-based similarity measure which could be used to assess the similarity in Indonesian text, such as Dice’s similarity coefficient, Cosine similarity, and Jaccard coefficient. It implemented together with Rabin-Karp algorithm that common used to detect plagiarism in Indonesian Language. The analysis technique of plagiarism is fingerprint analysis to create fingerprint document according to n-gram value that has been determined, then the similarity value will be counted according to the same number of fingerprint between texts. Small data text about Information System tested in this case and it divided into four kinds of text document with some modified. First document is original text, second is 50% of original text adding with 50% of another text, third 50% original text modified using sinonym and paraphase, fourth some position of text in original text changed. From the experimental result, cosine similarity show better performance in generating value accuracy compared to the dice coefficient and Jaccard coefficient. This model is expected to be used as an alternative type of statistical algorithms that implement the n-grams in the process especially to detect plagiarism in Indonesian text.
The accesible loose information through the Internet leads to plagiarism activities use the copy-... more The accesible loose information through the Internet leads to plagiarism activities use the copy-paste-modify practice is growing rapidly. There have been so many methods, algorithm, and even softwares that developed till this day to avoid and detect the plagiarism which can be used broadly unlimited on a certain subject. Research about detection of plagiarism in Indonesian Language develop day by day, although not significant as English Language. This paper proposes several models of distance-based similarity measure which could be used to assess the similarity in Indonesian text, such as Dice’s similarity coefficient, Cosine similarity, and Jaccard coefficient. It implemented together with Rabin-Karp algorithm that common used to detect plagiarism in Indonesian Language. The analysis technique of plagiarism is fingerprint analysis to create fingerprint document according to n-gram value that has been determined, then the similarity value will be counted according to the same number of fingerprint between texts. Small data text about Information System tested in this case and it divided into four kinds of text document with some modified. First document is original text, second is 50% of original text adding with 50% of another text, third 50% original text modified using sinonym and paraphase, fourth some position of text in original text changed. From the experimental result, cosine similarity show better performance in generating value accuracy compared to the dice coefficient and Jaccard coefficient. This model is expected to be used as an alternative type of statistical algorithms that implement the n-grams in the process especially to detect plagiarism in Indonesian text.
Abstrak - Jadwal kegiatan akademik merupakan pegangan penyelenggaraan administrasi pendidikan dan... more Abstrak - Jadwal kegiatan akademik merupakan pegangan penyelenggaraan administrasi pendidikan dan pengajaran, sehingga kegiatan dapat terlaksana sesuai dengan siklus semesteran atau tahunan yang mengacu pada kalender akademik dibawah ketetapan Rektor perguruan tinggi. Jadwal kegiatan akademik pada Program Studi Teknik Informatika Universitas Tanjungpura saat ini masih menggunakan media sosial dan papan pengumuman serta belum ada publikasi mengenai jadwal seminar dan sidang mahasiswa. Hal ini berdampak pada kurangnya informasi bagi mahasiswa yang ingin mendaftar menjadi peserta sidang dan seminar serta membuat lambatnya penyampaian informasi jika jadwal baru tersedia. Pada penelitian ini, dibuat aplikasi berbasis Android yang dapat membantu mahasiswa untuk mendapatkan informasi jadwal akademik dimana saja dan kapan saja selama terkoneksi dengan internet. Aplikasi ini juga dilengkapi dengan fitur push notification yang akan mengirimkan pesan kepada pengguna jika jadwal baru tersedia s...
Fungsi geotagging pada smartphone dapat dioptimalkan pemanfaatan dengan mengembangkan sistem pela... more Fungsi geotagging pada smartphone dapat dioptimalkan pemanfaatan dengan mengembangkan sistem pelaporan masyarakat terkait masalah pembangunan infrastruktur dan pelayanan publik. Masyarakat dapat berpartisipasi dengan cara mengirimkan foto yang mempunyai informasi geotagging terkait dengan masalah yang ada disekitarnya. Suatu sistem yang dirancang dan dikembangkan mampu mengolah informasi geotagging pada foto yang dimana hasil ekstraksinya akan diperoleh lokasi yang dilaporkan masyarakat dalam bentuk informasi koordinat lintang dan bujur yang selanjutnya disimpan dalam database dan dapat ditampilkan sebagai marker atau titik poin dalam peta ( map). Dengan menampilkan informasi lokasi tersebut, pemerintah atau instansi terkait dapat mengetahui lokasi laporan masyarakat tersebut, memantau persebaran daerah masalah, merencanakan dan mengambil tindakan penanggulangan secara cepat dan tepat, khususnya bagi daerah masalah yang jauh dari perhatian pemerintah.
Dalam bidang pengolahan bahasa alami dan sistem temu balik informasi, representasi sebuah data te... more Dalam bidang pengolahan bahasa alami dan sistem temu balik informasi, representasi sebuah data teks sangat penting untuk mendukung proses analisis data statistik di dalamnya. Data teks dengan bentuk tidak terstruktur dapat direpresentasikan secara sederhana menggunakan sekumpulan set kata yang disebut bag-of-words dan belum memiliki label atau kelas tertentu. Data unsupervised atau objek-objek yang belum memiliki label dapat dikelompokan menggunakan klustering berdasarkan kemiripan satu objek dengan objek lain. Artikel ini membahas perbandingan hasil pengelompokan unsupervised data menggunakan algoritma kluster yang tersedia pada tools Weka, yaitu SimpleKMeans, X-Means, dan Farthest First. SimpleKMeans dan XMeans digunakan untuk mengolah dataset dan mengelompokan berdasarkan jumlah kluster tetap yang digunakan, sedangkan Farthest First akan meletakan semua pusat kluster pada titik terjauh dari pusat kluster yang sudah ada untuk mengelompokan data. Dataset berasal dari UCI machine le...
Communications in Computer and Information Science, 2015
The accesible loose information through the Internet leads to plagiarism activities use the copy-... more The accesible loose information through the Internet leads to plagiarism activities use the copy-paste-modify practice is growing rapidly. There have been so many methods, algorithm, and even softwares that developed till this day to avoid and detect the plagiarism which can be used broadly unlimited on a certain subject. Research about detection of plagiarism in Indonesian Language develop day by day, although not significant as English Language. This paper proposes several models of distance-based similarity measure which could be used to assess the similarity in Indonesian text, such as Dice’s similarity coefficient, Cosine similarity, and Jaccard coefficient. It implemented together with Rabin-Karp algorithm that common used to detect plagiarism in Indonesian Language. The analysis technique of plagiarism is fingerprint analysis to create fingerprint document according to n-gram value that has been determined, then the similarity value will be counted according to the same number of fingerprint between texts. Small data text about Information System tested in this case and it divided into four kinds of text document with some modified. First document is original text, second is 50% of original text adding with 50% of another text, third 50% original text modified using sinonym and paraphase, fourth some position of text in original text changed. From the experimental result, cosine similarity show better performance in generating value accuracy compared to the dice coefficient and Jaccard coefficient. This model is expected to be used as an alternative type of statistical algorithms that implement the n-grams in the process especially to detect plagiarism in Indonesian text.
The accesible loose information through the Internet leads to plagiarism activities use the copy-... more The accesible loose information through the Internet leads to plagiarism activities use the copy-paste-modify practice is growing rapidly. There have been so many methods, algorithm, and even softwares that developed till this day to avoid and detect the plagiarism which can be used broadly unlimited on a certain subject. Research about detection of plagiarism in Indonesian Language develop day by day, although not significant as English Language. This paper proposes several models of distance-based similarity measure which could be used to assess the similarity in Indonesian text, such as Dice’s similarity coefficient, Cosine similarity, and Jaccard coefficient. It implemented together with Rabin-Karp algorithm that common used to detect plagiarism in Indonesian Language. The analysis technique of plagiarism is fingerprint analysis to create fingerprint document according to n-gram value that has been determined, then the similarity value will be counted according to the same number of fingerprint between texts. Small data text about Information System tested in this case and it divided into four kinds of text document with some modified. First document is original text, second is 50% of original text adding with 50% of another text, third 50% original text modified using sinonym and paraphase, fourth some position of text in original text changed. From the experimental result, cosine similarity show better performance in generating value accuracy compared to the dice coefficient and Jaccard coefficient. This model is expected to be used as an alternative type of statistical algorithms that implement the n-grams in the process especially to detect plagiarism in Indonesian text.
Uploads
Papers by Tari Mardiana