@my:
Context terjadi bisa dicari apabila terjadi pengulangan yang sama. Nah, karena tidak ada yang menyebut nama Indonesia dengan benar, maka sistem mempelajarinya bukan Indonesia. Sedangkan mereka yang sudah ada dulu (founding fathers/mothers) menyebut tanah air dengan sebutan Nusantara atau Indonesia.
Maka, pengeja yang dipakai oleh malaikat tidak mampu mendeteksi huruf audibel dari gramatika pengucapan doa mereka.
Selain itu, sistem pengejaan mana pun berdasarkan konteks harus melalui tahap pengenalan dan pembelajaran ("context learning"). Tentu saja, dalam pembuatan sistem ini dan struktur bahasa, sistem ini mengundang para pendiri negara untuk menetapkan bahasa yang dipakai, yakni berdasarkan EYD. Jadinya, sistem ini canggih dan adil karena sesuai dengan tujuan dan landasan negeri ini. Sistem ini menggunakan sampel mereka yang masuk surga.
Catatan sedikit, kebanyakan mereka yang masuk surga adalah generasi di tahun-tahun awal perjuangan. KKN yang merajalela di beberapa dekade terakhir membuat sampel dari dekade membuat jumlah mereka tidak signifikan.
Nah berikut ditentukan berdasarkan statistik, ditemukan pengucapan Indonesia: (*)
30,5% => "In-do-ne-si-a" ;
49% => "In-do-ne-sya"
20% => "In-do-ne-si-a"
0,02% => "En-do-ne-sia"
0,01% => "En-do-ne-sah"
dll.
(*) hal ini diambil dari cluster masing-masing penyebutan suku kata, seperti misalnya suku kata "si" merupakan suatu cluster dari kata-kata berikut:
"si", "syi", dan "sih".
Berdasarkan teorema pembelajaran di statistik, tentunya ada garis batas di mana data tersebut menjadi tidak valid dan diabaikan (below threshold). Berapakah data yang diabaikan? Ada 0,1% kata yang diabaikan karena dianggap sebagai pencilan dan dapat merusak distribusi. Selain itu, menurut logika context learning, ada data semisal datum "En-do-ne-sah" yang harus diabaikan.
Bagaimana mereka bisa menentukan EYD? Karena, setahu malaikat itu, pada sistem mereka dirancang berdasarkan GPS untuk menentukan gramatikal yang dipakai. Nah, pada negeri Indonesia, telah diset bahwa LC_LANG=id.ID_UTF-8, TZ='Asia/Jakarta'. Malaikat menentukan bahasanya dari situ.
Jadi, bukan masalah voice recognition-nya yang bapuk. Tapi, masalah penyebutan kata yang tidak benar. Ingat, 50 s.d. 55% kesalahan terjadi karena kesalahan pengguna.
Menurut EYD, kata Indonesia seharusnya dieja sebagai berikut:
"In-do-ne-si-a"
"In" seperti pada kata insyaf.
"Do" seperti pada kata dosa.
"Ne" seperti pada kata nestapa.
"Si-a" seperti dalam kata sia-sia
bukan
"En-do-ne-sah"
Itu sebabnya, Endonesah dan kawan-kawan dianggap sebagai kata baru dan di-look up pada basisdata yang sudah ada atau bahasa lain yang terdaftar. Akhirnya, diambil kesimpulan bahwa Endonesah dkk adalah suatu kata baru yang merujuk pada suatu nama. Namun, nama tersebut tidak memiliki obyek yang dapat.
Dapat disebut bahwa kata tersebut tidak benar dan menurut aturan spambayes, kata yang terlalu sering ditolak adalah suatu kunci untuk menentukan bahwa surat-surat yang mengandung kata tersebut most likely ditolak (rejected) atau dengan kata lain, spam.
Q.E.D
Nggg... ngerti, gak? :D
Context terjadi bisa dicari apabila terjadi pengulangan yang sama. Nah, karena tidak ada yang menyebut nama Indonesia dengan benar, maka sistem mempelajarinya bukan Indonesia. Sedangkan mereka yang sudah ada dulu (founding fathers/mothers) menyebut tanah air dengan sebutan Nusantara atau Indonesia.
Maka, pengeja yang dipakai oleh malaikat tidak mampu mendeteksi huruf audibel dari gramatika pengucapan doa mereka.
Selain itu, sistem pengejaan mana pun berdasarkan konteks harus melalui tahap pengenalan dan pembelajaran ("context learning"). Tentu saja, dalam pembuatan sistem ini dan struktur bahasa, sistem ini mengundang para pendiri negara untuk menetapkan bahasa yang dipakai, yakni berdasarkan EYD. Jadinya, sistem ini canggih dan adil karena sesuai dengan tujuan dan landasan negeri ini. Sistem ini menggunakan sampel mereka yang masuk surga.
Catatan sedikit, kebanyakan mereka yang masuk surga adalah generasi di tahun-tahun awal perjuangan. KKN yang merajalela di beberapa dekade terakhir membuat sampel dari dekade membuat jumlah mereka tidak signifikan.
Nah berikut ditentukan berdasarkan statistik, ditemukan pengucapan Indonesia: (*)
30,5% => "In-do-ne-si-a" ;
49% => "In-do-ne-sya"
20% => "In-do-ne-si-a"
0,02% => "En-do-ne-sia"
0,01% => "En-do-ne-sah"
dll.
(*) hal ini diambil dari cluster masing-masing penyebutan suku kata, seperti misalnya suku kata "si" merupakan suatu cluster dari kata-kata berikut:
"si", "syi", dan "sih".
Berdasarkan teorema pembelajaran di statistik, tentunya ada garis batas di mana data tersebut menjadi tidak valid dan diabaikan (below threshold). Berapakah data yang diabaikan? Ada 0,1% kata yang diabaikan karena dianggap sebagai pencilan dan dapat merusak distribusi. Selain itu, menurut logika context learning, ada data semisal datum "En-do-ne-sah" yang harus diabaikan.
Bagaimana mereka bisa menentukan EYD? Karena, setahu malaikat itu, pada sistem mereka dirancang berdasarkan GPS untuk menentukan gramatikal yang dipakai. Nah, pada negeri Indonesia, telah diset bahwa LC_LANG=id.ID_UTF-8, TZ='Asia/Jakarta'. Malaikat menentukan bahasanya dari situ.
Jadi, bukan masalah voice recognition-nya yang bapuk. Tapi, masalah penyebutan kata yang tidak benar. Ingat, 50 s.d. 55% kesalahan terjadi karena kesalahan pengguna.
Menurut EYD, kata Indonesia seharusnya dieja sebagai berikut:
"In-do-ne-si-a"
"In" seperti pada kata insyaf.
"Do" seperti pada kata dosa.
"Ne" seperti pada kata nestapa.
"Si-a" seperti dalam kata sia-sia
bukan
"En-do-ne-sah"
Itu sebabnya, Endonesah dan kawan-kawan dianggap sebagai kata baru dan di-look up pada basisdata yang sudah ada atau bahasa lain yang terdaftar. Akhirnya, diambil kesimpulan bahwa Endonesah dkk adalah suatu kata baru yang merujuk pada suatu nama. Namun, nama tersebut tidak memiliki obyek yang dapat.
Dapat disebut bahwa kata tersebut tidak benar dan menurut aturan spambayes, kata yang terlalu sering ditolak adalah suatu kunci untuk menentukan bahwa surat-surat yang mengandung kata tersebut most likely ditolak (rejected) atau dengan kata lain, spam.
Q.E.D
Nggg... ngerti, gak? :D
engga ada redirection bos? atau "did do mean:xxxxxx"?
ReplyDeletebukannya suku kata "ne" pada "Indonesia" dilafalkan seperti kata "ne" pada "nektar" yah? Kalo dilafalkan seperti kata "nestapa" berarti lafalnya adalah...
ReplyDeletebetul.... kata joolean...
ReplyDeletebukannya "ne" dilafalkan spt kt "nenek"
terus bedanya
30,5% => "In-do-ne-si-a" ;
20% => "In-do-ne-si-a" ??
bukannya dua-duanya sama
Wah iy, typo tuh. Tapi gw lupa seharusnya ditulis apa.
ReplyDeleteHmm.. bener nih.
ne harusnya dibaca seperti pada kata nekat.