BildningGymnasieutbildning och skolor

Närmaste granne metod: exempel på arbete

närmaste granne metoden är den enklaste metriska klassificerare som är baserad på utvärderingen av likheten mellan olika objekt.

Analyserade föremålet tillhör den klass som de tillhör ämnen utbildning prov. Låt oss ta reda som är den närmaste grannen. Försök att förstå den komplicerade frågan, exempel på olika tekniker.

hypotes metod

närmaste granne metoden kan anses vara den vanligaste algoritm som används för klassificering. Objektet genomgår klassificering tillhör klassen y_i, till vilket det närmaste objektet lära x_i prov.

Specificitet metoder närmaste grannar

k närmaste granne metod kan förbättra noggrannheten i klassificeringen. Analyserade föremålet tillhör samma klass som den största delen av sina grannar, det vill säga k nära det objekt av det analyserade provet x_i. Att lösa problem med två klasser av antalet grannar kommer att vara udda för att undvika en situation med tvetydighet, om samma antal grannar kommer att tillhöra olika klasser.

Tekniken med suspenderade grannar

Postgresql-analyserade metod tsvector närmaste grannar används när antalet klasser minst tre, och du kan inte använda ett udda antal. Men tvetydighet uppstår även i dessa fall. Då, det i: te granne blir w_i vikt, som minskar med grannen rang i. Den hänvisar till den klass av objektet, vilket kommer att ha en maximal total vikt bland nära grannar.

Hypotesen om kompakthet

I hjärtat av alla ovanstående metoder är hypotesen om kompakthet. Det antyder ett samband mellan mått på likheten mellan objekt och deras tillhörande samma klass. I denna situation är gränsen mellan de olika typerna en enkel form, och skapa klasser av objekt i rymden kompakt mobila området. Under sådana områden i matematisk analys menas en sluten begränsad mängd. Denna hypotes är inte relaterat till det vardagliga uppfattning av ordet.

Grundformeln

Låt oss undersöka mer närmsta granne. Om den föreslagna utbildningen provtyp "objekt-respons» X ^ m = \ {(x_1, y_1), \ prickar, (x_m, y_m) \}; om ett flertal föremål för att definiera avståndet funktionen \ rho (x, x '), som är representerad i form av ett lämpligt modell likheten av föremål genom ökning av värdet av funktionen minskar likheten mellan objekt x, x'.

För varje objekt, kommer u bygga en träningsprov objekt x_i med ökande avstånd till U:

\ Rho (u, X_ {1, u}) \ ekv \ rho (u, X_ {2, u}) \ ekv \ cdots \ ekv \ rho (u, X_ {m; u}),

där X_ {i; u} karakteriserar inlärningsprovet objektet, som är i: te granne källobjekt u. Sådan notation och använda för att svara på i: te granne: Y_ {i; u}. Som ett resultat, finner vi att något föremål u provocerar omnumrering egen prov.

Bestämning av antalet k grannar

Närmaste granne metod när k = 1 kan ge en felaktig klassificering, inte bara på objekt-utsläpp, men även för andra klasser som är nära.

Om vi tar k = m, kommer algoritmen att vara så stabil och kommer att degenerera till ett konstant värde. Därför är tillförlitligheten är viktigt att undvika extrema index k.

I praktiken, eftersom det optimala indexet k används kriterium glidstyrning.

filmvisningar utsläpp

Föremålet för studien är till stor del olika, men bland dem finns de som har egenskaperna hos en klass och kallas standarder. Vid Närheten till föremål för den ideala modellen för dess höga sannolikheten av att tillhöra denna klass.

Hur rezultativen metod för närmaste grannar? Ett exempel kan ses på basis av perifera och icke-informativa kategorier av objekt. Det antas tät miljö objekt andra representanter för denna klass. När du tar bort dem från klassificeringen av provtagning kvaliteten kommer inte att drabbas.

Få in ett visst antal prover kan brusskurar som är "på marken" i en klass. Avlägsnande av väsentligen positiv inverkan på kvaliteten på klassificeringen.

Om provet tas från intetsägande och eliminera brus objekt kan du räkna med några positiva resultat samtidigt.

Den första interpolationsmetod för den närmaste grannen klassificering gör det möjligt att förbättra kvaliteten, minska mängden lagrad data, minska tiden för klassificering, som går till valet av nästa standarder.

Användningen av ultra-stora prover

Närmaste granne Metoden bygger på den verkliga lagring av lärobjekt. Skapa mycket stora prover med ett tekniskt problem. Målet är inte bara att spara en betydande mängd information, men också i den minsta tid att ha tid att hitta något föremål u k bland de närmaste grannarna.

För att klara denna uppgift, är två metoder som används:

  • uttunnade prov via ett urladdnings icke-dataobjekt;
  • effektiv användning speciell datastruktur och koder för snabbsökning av de närmaste grannarna.

Regler urvalsmetoder

Ovanstående klassificering ansågs. Närmaste granne metod används för att lösa praktiska problem, som är känd i förväg avståndsfunktionen \ rho (x, x '). Beskriva föremål numeriska vektorer använder euklidiska mått. Detta val har ingen särskild motivering, men innebär mätning av alla skyltar "i samma skala." Om denna faktor inte tas med i beräkningen, då det metriska kommer att dominera funktion som har högsta numeriska värden.

Om det finns en avsevärd mängd funktioner, beräkna avståndet som summan av avvikelserna på vissa symptom allvarligt problem dimension.

I hög dimensionell rymd avstånd från varandra kommer alla objekt. I slutändan kommer alla prov vara bredvid objektet som studeras k grannar. valt ett mindre antal informativa funktioner för att eliminera detta problem. Algoritmer för beräkning beräkningar bygger på grundval av olika uppsättningar av tecken, och för varje individ att bygga deras närhet funktion.

slutsats

Matematiska beräkningar innebär ofta användning av en mängd olika tekniker som har sina egna särdrag, fördelar och nackdelar. Sett närmaste granne metod kan lösa ganska allvarligt problem, på grund av egenskaperna hos matematiska objekt. Den experimentella koncept, baserat på den analyserade metoden används aktivt i artificiell intelligens.

I expertsystem är det nödvändigt inte bara att klassificera objekt, men också visa användaren en förklaring av klassificeringen i fråga. I denna metod, är en förklaring till detta fenomen uttrycks i förhållande till föremålet för en viss klass såväl som dess placering i förhållande till det prov som används. Juridisk branschspecialister, geologer, läkare, ta denna "prejudikat" logik aktivt använder det i sin forskning.

För att analyseras metod var den mest tillförlitliga, effektiva och ger önskat resultat, måste du ta minst siffra k, samtidigt undvika utsläpp bland de analyserade objekten. Därför är användningen av standarder och urvalsmetod, samt optimering statistik.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sv.atomiyme.com. Theme powered by WordPress.