Memecahkan ‘Sandi Substitusi’
Pada tulisan terdahulu kita membahas tentang teknik penyandian dalam kriptografi klasik yaitu Sandi Substitusi. Nah sekarang kita akan membahas bagaimana memecahkan kode sandi dari sandi substitusi tersebut.
 
Kelemahan sandi substitusi adalah hubungan frekuensi kemunculan huruf pada plainteks (pesan) dan cipherteks (pesan rahasia/tersandi) yang tidak berubah. Jika huruf a dienkripsi menjadi huruf Y, dan a muncul sebanyak n kali, maka Y juga muncul sebanyak n kali. Hal ini dimanfaatkan kriptoanalis/penyerang untuk menemukan kuncinya. Penyerang memanfaatkan data statistik peluang kemunculan huruf berikut ini. Teknik seperti ini disebut dengan teknik analisis frekuensi.
Pada table disamping kanan disajikan frekwensi kemunculan 10 huruf yang sering keluar dalam Bahasa Indonesia. Data pada table dan semua huruf lainnya dapat kita bagi menjadi 4 bagian :
• A, mempunyai peluang 17,50 %
• N, I, E, mempunyai peluang antara 7,50 % sampai 10,50 %
• K, T, R, D, S, M, mempunyai peluang antara 4,50 % sampai 6,00 %
• B,C, F, G, H, J, L, O, P, Q, U, V, W, X, Y, Z mempunyai peluang dibawah 4,50 %

Praktik Dekripsi dengan Teknik Analisis Frekuensi
Coba pecahkan chipertext berikut yang didapat dari plaintext berbahasa Indonesia : WVYPRXTUTERPKGITCLPZTKTC TLYVMTQNLPIPQTKQMT

Dapat kita lihat bahwa T paling sering muncul, jadi dapat dicoba dK(T) = a. Huruf yang muncul 5 kali adalah P maka kemungkinan huruf tersebut plainteksnya n, i, atau e. Jumlah huruf dalam chipertext sedikit maka digunakan yang presentase lebih sedikit pada ‘bagian frekwensi huruf kedua (n,i,e)’ yaitu e, jadi dK(P) = e. Akan tetapi hal ini perlu diingat tidak selalu menjamin korespondensi yang sama
 .Untuk sementara hasil dari dua deskripsi menjadi seperti terlihat dibawah, hmm blum terlihat pola kalimatnya bukan. Kalau begitu kita lanjutkan ke huruf berikutnya.

Huruf berikutnya adalah K,L,dan Q muncul sebanyak 3 kali, jadi kita asumsikan menjadi antara k,t,r,d,s,m. Perhatikan huruf K dan L berdekatan dengan vocal (huruf dideskripsi diatas), dari beberapa kemungkinan r dan s yang paling memungkinkan dK(K) = r dan dK(L) = s. Huruf Q kemungkinan n atau i, dari kecocokan terlihat paling tepat Q tersebut plaintextnya n —> dK(Q) = n.
 

Analisis diatas sudah membuahkan hasil, kata terakhir bisa kita tebak [se-enarn-a] menjadi [sebenarnya]. Huruf yang ditebak adalah I dan M, dK(I) = b dan dK(M) = y. Wah dari hasil sebelumnya tadi kata terakhir kedua bisa ditebak juga N menjadi g. 

Berlanjut keanalisa berikutnya huruf C,Y,V, dan R semuanya mempunyai frekwensi muncil 2 kali. Kemungkinan huruf-huruf tersebut adalah i,k,t,d, atau m. Namun penempatan huruf C,T, dan R terlihat bukan merupakan huruf vocal tapi konsonan, jadi   dK(V) = i. Sisanya C,Y,dan R menunjuk ke huruf  k,t,d, dan m. Seperti yang terjadi pada ‘huruf P  yang menjadi e’ yang menggunakan piramida terbalik, kemungkinan terbesar C,Y,dan R adalah huruf m. Setelah dicocokan huruf yang tepat  dK(R) = m.
 

Nah hasil tersebut sudah dapat membuat kita menganalisa dengan mudah (baca: tebak langsung), dK(C) = h dan dK(Y) = l. Huruf C diganti h dan huruf Y diganti menjadi huruf l.

Hasil  analisa terakhir di atas dapat kita tebak langsung plaintextnya, kalimatnya adalah ‘FILEM DAPAT MERUBAH SEJARAH ASLI YANG SEBENARNYA’. Akan lebih mudah lagi kalau teksnya lebih banyak, jadi lebih menantang dan membuat otak kita menari-nari untuk dapat menganalisinya.
Kesimpulan
Memang sandi substitusi mempunyai jumlah kemungkinan kunci yang sangat besar, yaitu 26! ≈4 x1026 , tetapi sandi substitusi mempunyai kelemahan yang cukup fatal, yaitu hubungan frekuensi kemunculan huruf antara plainteks dengan cipherteks yang tidak bisa dihilangkan. Untuk mempersulit penyerang, sebaiknya digunakan bahasa yang tidak lazim digunakan, sehingga penyerang akan kesulitan dalam memecahkan cipherteks.
Sedangkan untuk pihak penyerang atau kriptoanalis harus mempunyai data-data frekuensi kemunculan huruf pada berbagai bahasa, termasuk juga bahasa-bahasa yang jarang digunakan, seperti bahasa daerah, bahasa kuno, dan sebagainya.
Dekripsi sandi substitusi dengan teknik analisis frekuensi memang menarik dan cukup menantang untuk dikerjakan. Bagi anda yang senang dengan hal berbau tantangan terutama tantangan otak, ini adalah salah satun pilihan terbaik. (dodis7)
____________________________________________________
Daftar Pustaka
Churchhouse, Robert. 2001.  Codes and Ciphers, Julius Caesar, the Enigma, and the Internet. UK: Cambridge University Press.
Ariyus, Dony. 2008. Pengantar Ilmu Kriptografi : Teori, Analisis, dan Implementasi. Yogyakarta: Andi Offset.
_____________________________________________________