Membuat Direktori di HDFS dan Menyalin File Hadoop

Dalam lingkungan Hadoop, Hadoop Distributed File System (HDFS) adalah sistem file yang digunakan untuk menyimpan dan mengelola data secara terdistribusi. Dalam artikel ini, kami akan membahas langkah-langkah untuk membuat direktori di HDFS dan menyalin file ke dalamnya. Melalui penjelasan yang mendalam dalam bahasa Indonesia, penulis berharap pembaca bisa memahami konsep dasar dari operasi-operasi ini sehingga dapat mengimplementasikannya dengan mudah.

Hadoop Foundation: distributed file system HDFS
Membuat Direktori di HDFS dan Menyalin File Hadoop

Pengenalan
Hadoop Distributed File System (HDFS) adalah sistem penyimpanan terdistribusi yang didesain untuk mengelola dan menyimpan data secara efisien pada cluster komputer. Dalam artikel ini, kita akan membahas tentang cara membuat direktori di HDFS dan menyalin file menggunakan perintah-perintah Hadoop.

1. Membuat Direktori di HDFS
Pertama-tama, kita perlu membuat direktori di HDFS sebelum bisa menyimpan atau menyalin file ke dalamnya. Untuk membuat direktori, kita bisa menggunakan perintah `hdfs dfs -mkdir`. Contoh penggunaannya adalah sebagai berikut:
“`
hdfs dfs -mkdir /user/mydirectory
“`
Perintah ini akan membuat direktori bernama mydirectory dalam direktori /user di HDFS. Jika Anda ingin membuat subdirektori di dalamnya, cukup tambahkan nama subdirektori setelah tanda / pada perintah tersebut.

Selain itu, jika Anda ingin membuat beberapa direktori sekaligus, Anda dapat menuliskannya secara bersamaan dalam satu baris dengan memisahkan masing-masing direktori dengan spasi, seperti contoh berikut:
“`
hdfs dfs -mkdir /user/directory1 /user/directory2 /user/directory3
“`

2. Menyalin File ke HDFS
Setelah berhasil membuat direktori di HDFS, langkah selanjutnya adalah menyalin file dari sistem lokal atau dari cluster yang sudah ada ke dalam HDFS. Perintah yang digunakan untuk melakukan hal ini adalah `hdfs dfs -put`. Contoh penggunaannya adalah sebagai berikut:
“`
hdfs dfs -put /local/path/file.txt /user/mydirectory
“`
Perintah ini akan menyalin file.txt dari sistem lokal ke direktori mydirectory di HDFS. Jika Anda ingin menyalin seluruh direktori beserta isinya, Anda dapat menggunakan opsi `-r` seperti berikut:
“`
hdfs dfs -put -r /local/path/directory /user/mydirectory
“`

Selain itu, jika Anda ingin menyalin file atau direktori dengan nama yang berbeda di HDFS, maka tambahkan nama baru setelah lokasi tujuan dalam perintah tersebut, seperti contoh berikut:
“`
hdfs dfs -put /local/path/file.txt /user/mydirectory/newfile.txt
“`

Kesimpulan
Dalam tutorial ini, kita telah belajar tentang cara membuat direktori di HDFS menggunakan perintah `hdfs dfs -mkdir`, serta cara menyalin file ke dalam HDFS menggunakan perintah `hdfs dfs -put`. Membuat direktori terlebih dahulu penting agar kita memiliki tempat untuk menyimpan file-file kita di Hadoop Distributed File System. Selain itu, dengan melakukan penyalinan file ke dalam HDFS, data kita dapat didistribusikan dan dikelola secara efisien pada cluster komputer.

Menggunakan perintah-perintah yang telah dijelaskan di atas akan mempermudah Anda dalam mengelola dan mengoperasikan data pada cluster Hadoop. Ingatlah untuk selalu mengganti `/user/mydirectory` sesuai dengan direktori yang ingin Anda buat atau gunakan sebagai tujuan penyalinan file. Selamat mencoba!

What is HDFS | Name Node vs Data Node | Replication factor | Rack Awareness | Hadoop🐘🐘Framework
Subscribe to our new channel: Hadoop Distributed File System (HDFS for short) is the primary data storage system used by Apache Hadoop applications to manage large amounts of data and support related big data analytics applications. Big Data(Complete Playlist): …

TINGGALKAN KOMENTAR

Silakan masukkan komentar anda!
Silakan masukkan nama Anda di sini