Jumat, 26/6/26 | 04:11 WIB
  • Dapur Redaksi
  • Disclaimer
  • Pedoman Pemberitaan Media Siber
  • Tentang Kami
Scientia Indonesia
  • BERITA
    • UTAMA
    • DAERAH
    • NASIONAL
    • INTERNASIONAL
    • HUKUM
    • DESTINASI
    • HIBURAN
  • LITERASI
    • ARTIKEL
    • CERPEN
    • KLINIK BAHASA
    • KREATIKA
    • PUISI
  • RENYAH
  • TIPS
No Result
View All Result
  • BERITA
    • UTAMA
    • DAERAH
    • NASIONAL
    • INTERNASIONAL
    • HUKUM
    • DESTINASI
    • HIBURAN
  • LITERASI
    • ARTIKEL
    • CERPEN
    • KLINIK BAHASA
    • KREATIKA
    • PUISI
  • RENYAH
  • TIPS
No Result
View All Result
Scientia Indonesia
No Result
View All Result
  • BERITA
  • LITERASI
  • RENYAH
  • TIPS
Home LITERASI KLINIK BAHASA

Korpus Bahasa Indonesia

Minggu, 05/5/24 | 14:10 WIB
Oleh: Ria Febrina (Dosen Program Studi Sastra Indonesia FIB Universitas Andalas dan Mahasiswa Program Doktor Ilmu-Ilmu Humaniora Universitas Gadjah Mada)

Suatu hari saya mencari sebuah kata dalam Kamus Besar Bahasa Indonesia (KBBI). Kata ini merupakan kosakata klasik, yaitu wirawan. Kosakata ini sudah ada dalam Logat Ketjil Bahasa Indonesia (Poerwadarminta, 1951) yang bermakna ‘gagah berani’.  Poerwadarminta kemudian melengkapi makna kata ini menjadi ‘gagah berani; pahlawan’ dalam Kamus Umum Bahasa Indonesia (1952). Dalam kamus-kamus lain, seperti Kamus Modern Bahasa Indonesia (Sutan Mohammad Zain), serta Kamoes Indonesia dan Kamus Indonesia Ketjik (E. St. Harahap), kosakata ini belum tercantum sebagai kosakata bahasa Indonesia.

Dalam KBBI, Badan Pengembangan dan Pembinaan Bahasa Republik Indonesia sudah membedakan penggunaan kata wirawan sebagai kata benda yang bermakna ‘pahlawan’ dan kata sifat yang bermakna ‘gagah perkasa, gagah berani’. Namun, KBBI tidak mencantumkan etimologi bahwa kata ini berasal dari bahasa Sanskerta. Jika menelusuri kosakata dalam KBBI, kita akan menemukan bahwa sejumlah kosakata yang diserap dari bahasa daerah dan bahasa asing sudah tidak mendapatkan pelabelan dari mana bahasa tersebut berasal. Hal tersebut terjadi karena masyarakat Indonesia sudah tidak menganggap lagi bahwa kosakata tersebut sebagai kosakata asing sehingga Badan Pengembangan dan Pembinaan Bahasa Republik Indonesia juga tidak mencantumkan lagi etimologi kata tersebut.

Etimologi kata wirawan sebagai kosakata yang diserap dari bahasa Sansekerta dapat ditemukan pada lema berjenis ungkapan berupa wira ananta rudhira yang bermakna ‘tabah sampai akhir; semboyan Satuan Kapal Selam TNI AL’ dan wira dharma bhakti ‘yang bermakna dengan semangat dan jiwa kepahlawanan, kita tunaikan kewajiban; semboyan Komando Daerah Udara (KODAU) IV’. Namun, penggunaan kata wirawan dan kedua ungkapan tersebut tidak ada dalam KBBI.

Dalam kajian leksikografi, sebuah kata menjadi bagian dalam sebuah kamus karena kosakata tersebut terekam telah dipakai oleh masyarakat. Karena kata wirawan sudah tercantum dalam kamus pada tahun 1950-an, penggunaan kata ini tentu sudah tercantum dalam sumber-sumber lisan pada masa itu, seperti rekaman radio dan televisi atau sumber tertulis berupa media cetak, buku, poster, atau sumber-sumber tertulis lainnya. Sayangnya, Badan Pengembangan dan Pembinaan Bahasa Republik Indonesia yang menjadikan Kamus Umum Bahasa Indonesia (Poerwadarminta, 1952) sebagai sumber kosakata KBBI tidak melengkapi kata wirawan dengan contoh penggunaan kata dalam KBBI. Dalam kondisi seperti ini, apa yang harus kita lakukan? Ke mana kita dapat melacak penggunaan kata dalam bahasa Indonesia?

BACAJUGA

Memahami Kembali Imbuhan memper-

Perbedaan kata “bantu” dan “tolong”

Minggu, 21/6/26 | 13:50 WIB
Kapitil, Kosakata Baru dalam Kamus Besar Bahasa Indonesia

Kesalahan Bahasa yang Diproduksi AI

Minggu, 07/6/26 | 22:48 WIB

Dulu sekali kita pasti akan menggunakan mesin pencari, seperti Google. Google dapat menghubungkan kita dengan sejumlah laman yang memuat kosakata tersebut. Namun, Google mempunyai keterbatasan. Untuk kosakata klasik, kosakata arkais, atau kosakata yang tidak populer, Google belum mampu melacak penggunaan kata tersebut karena kosakata tersebut masih tersimpan pada sumber lisan atau sumber tertulis yang belum diunggah secara digital.

Meskipun demikian, teknologi digital yang berkembang pada hari ini dapat membantu kita dalam menemukan contoh penggunaan kata yang tidak terekam dalam KBBI. Sejumlah lembaga-lembaga khusus telah mengumpulkan kosakata bahasa Indonesia dan menghasilkan korpus bahasa Indonesia. Korpus secara harfiah bermakna ‘badan’ dan dalam kajian bahasa mengacu pada ‘sampel dari data bahasa yang natural atau otentik’ (Mc Enery et. al, 2006). Itulah sebabnya, kata korpus pada hari ini semakin populer dipakai, terutama bagi leksikografer, peneliti, penerjemah, dan pembelajar bahasa.

Apakah pengguna bahasa Indonesia yang tidak memfokuskan diri pada kajian bahasa bisa menggunakan korpus tersebut? Jawabannya tentu saja bisa. Secara sederhana, Prihantoro (2022) dalam Buku Referensi Pengantar Linguistik Korpus menjelaskan bahwa artikel yang terdapat dalam surat kabar online dan kompilasi cuitan di X (dulu Twitter) dan status Facebook, dapat disebut dengan korpus. Kita dapat menemukan penggunaan kosakata bahasa Indonesia dalam sumber-sumber tersebut. Namun, dalam kajian ilmiah, sejumlah lembaga sudah menghadirkan korpus bahasa Indonesia secara khusus. Dengan menggunakan korpus ini, kita dapat mengenal lebih dalam, seperti apa sebuah kata dipakai oleh pengguna bahasa Indonesia.

Salah satu korpus yang bisa ditelusuri terdapat di Sketch Engine (https://app.sketchengine.eu/). Sketch Engine merupakan pengelola korpus dan perangkat lunak analisis teks yang dikembangkan oleh Lexical Computing CZ s.r.o. sejak tahun 2003. Kita dapat menggunakan Sketch Engine untuk menemukan penggunaan kosakata bahasa Indonesia dalam dua korpus bahasa Indonesia, yakni Indonesia Web (Indonesian Wac) yang memiliki 90.120.046 token dan Indonesian Web 2020 (idTenTen20) yang memiliki 3.687.192.045 token. Token merupakan ‘kemunculan kata, angka, atau huruf yang terpisahkan oleh spasi dalam suatu teks’. Dengan demikian, kita dapat melihat betapa banyaknya penggunaan kata dalam dua korpus bahasa Indonesia di Sketch Engine tersebut.

Bagaimana caranya menggunakan Sketch Engine? Kita dapat membuat akun secara gratis. Dengan akun tersebut, kita dapat menggunakan korpus yang disediakan. Ada puluhan korpus dalam Sketch Engine, seperti korpus bahasa Inggris, Arab, Cina, Jerman, Perancis, Jepang, India, Korea, Italia, Portugis, Rusia, Spanyol, Afrika, dan juga korpus bahasa Indonesia. Selain itu, kita juga dapat membangun ruang penyimpanan sendiri hingga satu juta kata, misalnya kita mengumpulkan kosakata dari kompilasi cuitan di X (dulu Twitter) dan status Facebook, lalu mengunggahnya ke Sketch Engine. Kita dapat memberi nama korpus tersebut sesuka hati. Setelah selesai diunggah, kita dapat mengecek penggunaan kata tertentu pada korpus yang dibangun tersebut.

Karena penggunaan kata wirawan tidak ada dalam KBBI, saya pun menggunakan korpus bahasa Indonesia yang disediakan Sketch Engine. Dengan menggunakan fitur concordance atau konkordansi, saya mengetikkan kata wirawan pada korpus Indonesian Web 2020 (idTenTen20). Sketch Engine menyajikan 7.135 baris konkordansi kata wirawan. Siapa sangka bahwa ternyata kata wirawan terekam sebagai nama orang, seperti Sarlito Wirawan, Denny Wirawan, Bambang Wiraman, I Made Wirawan, Wirawan Winarto, Putu Edi Wirawan, Chandra Wirawan, Sarlito Wirawan, dan Pandu Wirawan.  Dari 500 baris konkordasi teratas, disajikan sebanyak 498 merupakan nama orang yang menggunakan kata wirawan dan dua lagi merupakan kosakata bahasa Indonesia yang bermakna ‘pahlawan’. Kedua penggunaan kata tersebut dapat dilihat sebagai berikut.

(1) Setiap bulan November diperingati sebagai hari pahlawan guna menghargai jasa para wirawan tanah air.
(2) Malangnya, Laksamana Sunan bukan lagi wirawan. Kudratnya lenyap dan ditawan penjajah yang menaklukkan Melaka.

Dari kedua data tersebut, tampak bahwa kata wirawan merupakan kosakata yang tidak dipakai lagi oleh masyarakat Indonesia. Para pengguna bahasa Indonesia hari ini lebih suka menggunakan kata pahlawan daripada wirawan. Karena tidak digunakan lagi, Badan Pengembangan dan Pembinaan Bahasa Republik Indonesia menjelaskan kata ini sebagai kata klasik dalam KBBI.

Meskipun penggunaan kata ini sudah terbatas, masyarakat Indonesia sudah merekam kata ini sebagai kosakata bahasa Indonesia sehingga kemudian dilekatkan pada nama. Hampir semua nama menunjukkan bahwa wirawan merupakan nama seorang laki-laki. Hal tersebut berkenaan dengan makna yang melekat pada wirawan berupa ‘gagah perkasa; gagah berani’. Dalam bahasa Indonesia, kata perkasa merupakan kata sifat yang melekat pada laki-laki.

Dengan demikian, korpus Indonesian Web 2020 (idTenTen20) telah menunjukkan bagaimana pengguna bahasa Indonesia menggunakan kata wirawan dari masa ke masa. Pada awalnya, kata ini bermakna ‘1. pahlawan, 2. gagah perkasa; gagah berani’. Namun, kreativitas berbahasa menyebabkan orang-orang Indonesia menggunakan kata ini sebagai sebuah nama dan juga menjadi sebuah doa. Seseorang yang bernama wirawan diharapkan kelak dapat menjadi seorang pahlawan atau seseorang yang gagah perkasa dan gagah berani.

Hasil penelusuran kata wirawan dalam korpus tersebut menunjukkan bahwa kita masih bisa menelurusi penggunaan kata dalam korpus-korpus bahasa Indonesia ketika tidak dapat menemukannya dalam KBBI. Selain Sketch Engine, juga ada korpus bahasa Indonesia lainnya berupa CQPWeb yang dikembangkan oleh Universitas Lancaster (https://cqpweb.lancs.ac.uk), korpus Leipzig yang dikembangkan oleh Universitas Leipzig (https://corpora.uni-leipzig.de), dan korpus Indonesia (KoIn) yang dikembangkan oleh Badan Pengembangan dan Pembinaan Bahasa Republik Indonesia (https://korpusindonesia.kemdikbud.go.id).

Di antara korpus tersebut, ada yang mewajibkan untuk membuat akun, ada juga yang mengizinkan langsung akses tanpa akun. Kesempatan akses ini dapat menambah wawasan kita bagaimana sebuah kata dipakai oleh masyarakat Indonesia. Jadi, jika tidak menggunakan contoh penggunaan kata dalam KBBI, kita dapat memanfaatkan korpus bahasa Indonesia di berbagai sistem berbasis web tersebut. Selamat mencoba!

Tags: #korpus bahasa Indonesia#Ria Febrina
ShareTweetShareSend
Berita Sebelum

Menyusuri Pusat Surga Belanja Shinsegae

Berita Sesudah

Ingat Wajah, Tapi Tidak Namanya

Berita Terkait

Memahami Kembali Imbuhan memper-

Perbedaan kata “bantu” dan “tolong”

Minggu, 21/6/26 | 13:50 WIB

Oleh: Reno Wulan Sari (Dosen Bahasa Indonesia bagi Penutur Busan University of Foreign Studies, Korea Selatan) Kata bantu dan tolong...

Kapitil, Kosakata Baru dalam Kamus Besar Bahasa Indonesia

Kesalahan Bahasa yang Diproduksi AI

Minggu, 07/6/26 | 22:48 WIB

Oleh: Ria Febrina (Dosen Prodi Sastra Indonesia dan S2 Linguistik FIB Universitas Andalas) Beberapa waktu lalu, saya menyunting beberapa buku....

Rendang Lokan, Makanan Khas Pesisir Selatan

Memahami Makna Peribahasa “Muluik Manih Kucindan Murah”

Senin, 01/6/26 | 08:57 WIB

Oleh: Yori Leo Saputra (Guru SMA 1 Ranah Pesisir, Kabupaten Pesisir Selatan)   Minangkabau memiliki banyak peribahasa. Peribahasa merupakan kelompok...

Child Grooming sebagai Bentuk Frasa “Manipulasi Anak”

Bahasa Estetik dalam Luka “Gaza Tak Pernah Sunyi” Karya Hardi

Senin, 25/5/26 | 00:01 WIB

Oleh: Elly Delfia (Dosen Prodi Sastra Indonesia dan S2 Linguistik FIB Universitas Andalas) Di tanah ini, sejarah bukan hanya di...

Memahami Kembali Imbuhan memper-

Konteks Kata “Kali” dalam Bahasa Indonesia

Minggu, 17/5/26 | 13:37 WIB

Oleh: Reno Wulan Sari (Dosen Bahasa Indonesia bagi Penutur Asing Busan University of Foreign Studies, Korea Selatan) Kata kali dikenal...

Kapitil, Kosakata Baru dalam Kamus Besar Bahasa Indonesia

Cerita Mahasiswa Arab tentang Bahasa Indonesia

Senin, 27/4/26 | 06:18 WIB

Oleh: Ria Febrina (Dosen Prodi Sastra Indonesia dan S2 Linguistik FIB Universitas Andalas) Saat mengawas UTBK (Ujian Tulis Berbasis Komputer)...

Berita Sesudah
Satu Tikungan Lagi

Ingat Wajah, Tapi Tidak Namanya

Discussion about this post

POPULER

  • DPRD Kota Padang prihatin, terhadap semrawutnya Sistem Penerimaan Murid Baru (SPMB) di Kota Padang, khususnya berpusat pada kendala sistem aplikasi yang error.

    Ketua DPRD Kota Padang Muharlion Menilai Kurangnya Persiapan Disdik Dalam Pelaksanaan Sistem SPMB Tahun 2026

    0 shares
    Share 0 Tweet 0
  • Peduli di Layar, Abai di Jalan: Ironi Aktivisme Lingkungan di Era Digital

    0 shares
    Share 0 Tweet 0
  • Tanda Titik pada Singkatan Nama Perusahaan

    0 shares
    Share 0 Tweet 0
  • Kesalahan Bahasa yang Diproduksi AI

    0 shares
    Share 0 Tweet 0
  • Cempaka Tanjung Pimpin Perempuan Bangsa Sumbar

    0 shares
    Share 0 Tweet 0
  • DPRD Bukittinggi Lahirkan Sejumlah Rekomendasi atas LPJ Wali Kota Tahun Anggaran 2025

    0 shares
    Share 0 Tweet 0
  • Hubungan Sinonim Kata “Mempunyai” dan “Memiliki”

    0 shares
    Share 0 Tweet 0
Scientia Indonesia

PT. SCIENTIA INSAN CITA INDONESIA 2026

Navigate Site

  • Dapur Redaksi
  • Disclaimer
  • Pedoman Pemberitaan Media Siber
  • Tentang Kami

Follow Us

No Result
View All Result
  • BERITA
    • UTAMA
    • DAERAH
    • NASIONAL
    • INTERNASIONAL
    • HUKUM
    • DESTINASI
    • HIBURAN
  • LITERASI
    • ARTIKEL
    • CERPEN
    • KLINIK BAHASA
    • KREATIKA
    • PUISI
  • RENYAH
  • TIPS

PT. SCIENTIA INSAN CITA INDONESIA 2026