Dalam perkembangan kecerdasan buatan dan visi komputer yang pesat saat ini, ImageNet tidak diragukan lagi merupakan proyek yang menarik dan berjangkauan luas. Basis data visual yang sangat besar ini secara khusus dirancang untuk penelitian perangkat lunak pengenalan objek visual dan mencakup lebih dari 14 juta gambar, yang masing-masing telah diberi anotasi manual secara akurat untuk mengidentifikasi objek dalam gambar. Dengan kemajuan teknologi kecerdasan buatan, kepentingan relatif ImageNet menjadi semakin menonjol.
Peneliti AI Li Fei-Fei mulai memahami konsep ImageNet pada tahun 2006. Saat itu, sebagian besar penelitian AI berfokus pada model dan algoritme, dan Li menyadari pentingnya memperluas dan meningkatkan data yang tersedia untuk melatih algoritme AI. Ambisinya jelas, karena pekerjaan anotasi antara tahun 2008 dan 2010 akhirnya mengumpulkan lebih dari 14 juta gambar, dan gambar-gambar ini mencakup lebih dari 20.000 kategori objek.
Sejak 2006, Li Fei-Fei dan tim penelitinya telah menggunakan Amazon Mechanical Turk untuk klasifikasi gambar. Melalui metode crowdsourcing ini, mereka memastikan bahwa setiap gambar dapat menerima anotasi standar.
Dalam tantangan ImageNet 2012, kelahiran AlexNet, jaringan saraf konvolusional (CNN), bagaikan angin puyuh, yang memfokuskan kembali dunia teknis pada kemungkinan jaringan saraf. AlexNet mencapai rasio kesalahan lima teratas sebesar 15,3% dalam tantangan tersebut, jauh melampaui entri lainnya. Tonggak sejarah ini menandai datangnya revolusi pembelajaran mendalam.
Seperti yang dilaporkan The Economist, "Tiba-tiba, semua orang memperhatikan tidak hanya komunitas AI, tetapi juga seluruh industri teknologi."
Proses anotasi ImageNet mengadopsi model crowdsourcing. Anotasi tingkat gambar digunakan untuk menunjukkan keberadaan kategori objek dalam gambar, seperti "Gambar ini memiliki seekor harimau" atau "Gambar ini tidak memiliki seekor harimau." Metode anotasi mendalam ini dengan cermat mengkategorikan "synset" yang menjadi milik setiap gambar. Setiap set memiliki ID WordNet uniknya sendiri untuk memudahkan identifikasi lebih lanjut.
Kompetisi virtual ImageNet Large Scale Visual Recognition Challenge (ILSVRC) telah diadakan setiap tahun sejak 2010. Tantangan ini tidak hanya meningkatkan akurasi pengenalan gambar, tetapi juga menarik partisipasi sejumlah besar peneliti, yang secara bertahap menjadi acara besar dalam industri ini.
Li Fei-Fei menyebutkan bahwa ia berharap melalui tantangan ini, "ImageNet akan menjadi platform yang lebih demokratis sehingga algoritme berbagai tim peneliti dapat dibandingkan pada kumpulan data ini."
Melihat ke masa depan, ImageNet menghadapi kebutuhan akan pembaruan dan peningkatan. Pada tahun 2021, kami memperkuat tinjauan bias data dan menyaring beberapa kategori keraguan untuk meningkatkan rasa tanggung jawab model. Kemajuan teknologi AI berarti akan ada lebih banyak tantangan dan peluang di masa depan.
Dalam pengembangan kecerdasan buatan, peran ImageNet tidak lagi terbatas pada basis data, tetapi proses kemajuan dan evolusi yang berkelanjutan. Seiring dengan semakin matangnya teknologi, akankah kita melihat sistem AI yang lebih cerdas lahir dalam waktu dekat? Apakah pertanyaan ini layak direnungkan?