R da tekshirilmagan o'rganishmi? Matritsalarni tasniflash - to'g'ri paket nima?

Yaqinda men Stenfordning ko'plab kulgili Ochiq sinf xonalari video ma'ruzalarini tomosha qildim. Ayniqsa, tekshirilmagan Mashinani o'rganish qismi mening e'tiborimni tortdi. Afsuski, bu to'xtab qolsa, u yanada qiziqarli bo'lishi mumkin edi.

Asosan men tekshirilmagan algoritm bilan alohida matritsalarni tasniflashni qidiraman. Ushbu matritsalar bir xil intervalli alohida qiymatlarni o'z ichiga oladi. Keling, men 1 dan 3 gacha bo'lgan qiymatlar bilan 20x15 matritsa borligini aytaylik. Men adabiyot orqali o'qishni boshladim va tasvirni tasniflash yanada murakkab (rangli gistogrammalar) deb hisoblayman va mening ishim bu erda amalga oshiriladigan ishlarning soddalashuvidir.

Shuningdek, Mashina o'rganish va Klaster Kran vazifalari ko'rinishi, lekin amaliy namunadan qayerdan boshlashini bilmayman.

Shunday qilib mening savolim: qaysi paket/algoritm R atrofida o'ynashni boshlash va muammo bo'yicha ishlash uchun yaxshi tanlov bo'ladi?

EDIT: Mumkin bo'lmagan bo'lishi mumkinligini tushunib etdim: Mening matrisimda diskret tanlash ma'lumotlari mavjud - shuning uchun kümelenme (!) To'g'ri fikr emas. Men vektorlar va kuzatishlar haqida aytgan narsalaringiz bilan tushunaman, lekin matrisalar yoki data.frameslarni qabul qiladigan ba'zi funktsiyalarni umid qilaman, chunki vaqt ichida bir nechta kuzatishlar bor.

EDIT2: Men toifadagi ma'lumotlarning tasniflanmagan tasnifiga e'tibor qaratadigan bir to'plam/funktsiya, bu menga eng to'g'ri yordam beradigan narsa.

2
kutubxonasida (class) va hclust ichida kmeans - bu ikkita asosiy hisoblanadi.
qo'shib qo'ydi muallif hatmatrix, manba
kategorik ma'lumotlarga ishlaydimi?
qo'shib qo'ydi muallif Matt Bannert, manba
@larsmans, thx! Siz yaxshi tushungan narsalarni yaxshi o'qiyapsizmi?
qo'shib qo'ydi muallif Matt Bannert, manba
@Rank2: har qanday kümeleme algoritması kategorik ma'lumotlarga to'g'ri sozlamalar bilan ishlaydi. 1-K kodlashni ishlatish Yaxshi Fikr va sizning klasterizatsiya to'plamingiz bir nechta masofali o'lchovlarni taklif qilsa, siz Euclidean o'rniga L1 masofasini sinab ko'rishingiz mumkin.
qo'shib qo'ydi muallif Fred Foo, manba
@ ran2: mening ML bilimlarimning aksariyati amaliyot va hamkasblar bilan suhbatdan iborat. Bahs qilamanki, ESL da juda ko'p ma'lumot topa olasiz.
qo'shib qo'ydi muallif Fred Foo, manba

3 javoblar

1
qo'shib qo'ydi
Buni kim qildi? Men pastga tushmayapman, chunki bu faqatgina menga yordam berishga harakat qilmoqda. Men bu linkni asl nashrimda e'lon qilganman. Agar bu RTFM deb aytsa, aynan buni to'g'ri deb yozgan bo'lar edim.
qo'shib qo'ydi muallif Matt Bannert, manba
Xavotir olmang :) Men sizni ayblamayman, faqat tasodifiy haqida hayron qoldim. Shu orada men juda ko'p ma'lumotlarga ega bo'ldim, lekin bu boshlang'ich nuqtani topish qiyin bo'lgan (boshqa R masalalariga nisbatan). atrofida juda ko'p narsa bor - ayniqsa, siz izlayotgan narsalarni aniq bilmasangiz. Haqiqatan ham ba'zi paketlar topildi va umid qilamanki, keyinroq bu haqda qisqacha ma'lumot berish uchun etarli ma'lumotni topasiz.
qo'shib qo'ydi muallif Matt Bannert, manba
Men sizning asl nashringizda e'lon qilingan CRAN ml saytini sezmadim ....!
qo'shib qo'ydi muallif iinception, manba

Hozircha daisy kodini cluster to'plamidan topdim, bu esa o'z navbatida Gower ning o'xshashlik koeffitsienti degan ma'noni anglatuvchi "gower" argumentidir. Gower, faqatgina masofa o'lchovi kabi ko'rinadi, biroq aniq ma'lumotlardan foydalanish uchun topilgan narsam.

0
qo'shib qo'ydi

... tekshirilmagan algoritm bilan alohida matritsalarni tasniflash

Ularni kümelendirmek kerak. Tasnifi odatda boshqariladigan algoritmlar tomonidan amalga oshiriladi.

Tasvir tasniflashning murakkabligi (rangli histogramlar) ekanligini va mening ishim u erda amalga oshirilgan ishlarning soddalashtirilishi deb hisoblayman.

Matrisleringizning nimani anglatishini bilmasangiz, qanday algoritm kerakligini tushuntirish qiyin. Biroq boshlang'ich nuqta uzunligi 300 Vektor ishlab chiqarish uchun 20 * 15 matritsani tekislash uchun bo'lishi mumkin; Bunday vektorning har bir elementi keyinchalik kommersatsiyani asoslash uchun xususiyati (yoki variable ) bo'ladi. O'zingiz ishlaydigan Cluster to'plami, shu jumladan, ML paketlarini qilish kerak: "Agar matritsa yoki ma'lumotlar doirasi bo'lsa, har bir satr bir kuzatuvga mos keladi va har bir ustun o'zgaruvchiga mos keladi. "

0
qo'shib qo'ydi
Nopoklik uchun uzr so'rayman. Hozirgi lavozimimni tahrir qildim.
qo'shib qo'ydi muallif Matt Bannert, manba
Tarixiy jihatdan, odatda klaster sifatida tanilgan narsa tasnifi deb ataladi. Hatto shu nom bilan taniqli kitob mavjud: Amazon. com/& hellip;
qo'shib qo'ydi muallif Hong Ooi, manba