Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) 9. ledna 2017


1 Vytěžování dat Filip Železný Katedra kybernetiky skupina Inteligentní Datové Analýzy (IDA) 9. ledna 20172 ...

0 downloads 0 Views 1010KB Size

Recommend Documents


Fakulta elektrotechnická Katedra kybernetiky
1 České vysoké učení technické v Praze Fakulta elektrotechnická Katedra kybernetiky DIPLOMOVÁ PRÁCE A...

Katedra kybernetiky, FEL, ČVUT v Praze
1 Symbolické metody učení z příkladů Jiří Kléma Katedra kybernetiky, FEL, ČVUT v Praze2 pplán předná&...

Katedra kybernetiky, FEL, ČVUT v Praze
1 Strojové učení a dolování dat přehled Jiří Kléma Katedra kybernetiky, FEL, ČVUT v Praze2 posnova předn&aac...

Západočeská univerzita v Plzni. Fakulta aplikovaných věd. Katedra kybernetiky
1 Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra kybernetiky BAKALÁŘSKÁ PRÁCE Fúze v...

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra kybernetiky
1 Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra kybernetiky BAKALÁŘSKÁ PRÁCE Plzeň, 2016 J...

Fakulta aplikovaných věd Katedra kybernetiky. Detekce sémantických entit
1 Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra kybernetiky BAKALÁŘSKÁ PRÁCE Detekce s&eac...

Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra kybernetiky
1 Západočeská univerzita v Plzni Fakulta aplikovaných věd Katedra kybernetiky DIPLOMOVÁ PRÁCE PLZEŇ, 2013 TOM&Aacut...

číslo 1 ročník XXVIII 9. ledna 2017 cena 3,- Kč
1 Vážení spoluobčané, číslo 1 ročník XXVIII 9. ledna 2017 cena 3,- Kč se vstupem do nového roku 2017 mi dovo...

MĚSTO DOKSY. USNESENÍ Rady města Doksy dne 9. ledna 2017
1 MĚSTO DOKSY USNESENÍ Rady města Doksy dne 9. ledna 2017 R 2/17 Změna rozpočtů schválených grantů z Grantového fondu na r...



Vytˇeˇzov´an´ı dat ˇ Filip Zelezn´ y Katedra kybernetiky skupina Inteligentn´ı Datov´ e Anal´ yzy (IDA)

9. ledna 2017

Rozhodovac´ı pravidla

I

Strom lze pˇrev´est na seznam pravidel ve tvaru if hpodm´ınkyi then htˇr´ıdai

if teplota=horeˇcka & bolest sval˚ u= ano then chˇripka

Rozhodovac´ı pravidla

I

Strom lze pˇrev´est na seznam pravidel ve tvaru if hpodm´ınkyi then htˇr´ıdai

if teplota=horeˇcka & bolest sval˚ u= ano then chˇripka if teplota=horeˇcka & bolest sval˚ u= ne then nachlazen´ı

Rozhodovac´ı pravidla

I

Strom lze pˇrev´est na seznam pravidel ve tvaru if hpodm´ınkyi then htˇr´ıdai

if teplota=horeˇcka & bolest sval˚ u= ano then chˇripka if teplota=horeˇcka & bolest sval˚ u= ne then nachlazen´ı if teplota=zv´yˇsen´a then nachlazen´ı

Rozhodovac´ı pravidla I

Strom lze pˇrev´est na seznam pravidel ve tvaru if hpodm´ınkyi then htˇr´ıdai if teplota=horeˇcka & bolest sval˚ u= ano then chˇripka u= if teplota=horeˇcka & bolest sval˚ ne then nachlazen´ı if teplota=zv´yˇsen´a then nachlazen´ı if teplota=norm´aln´ı then hypochondr

I

Pravidla lze ale hledat i pˇr´ımo z dat.

Hled´an´ı pravidla

Chceme naj´ıt nejlepˇs´ı pravidlo pro tˇr´ıdu spl´ ac´ı pˇr´ıjem bydliˇstˇ e vysok´y Praha vysok´y Plzeˇ n n´ızk´y Praha vysok´y Praha stˇredn´ı Brno

pohlav´ı u ´vˇ er M spl´ac´ı M spl´ac´ı M nespl´ac´ı ˇ Z spl´ac´ı M spl´ac´ı

Hled´an´ı pravidla

Chceme naj´ıt nejlepˇs´ı pravidlo pro tˇr´ıdu spl´ ac´ı pˇr´ıjem bydliˇstˇ e vysok´y Praha vysok´y Plzeˇ n n´ızk´y Praha vysok´y Praha stˇredn´ı Brno

pohlav´ı u ´vˇ er M spl´ac´ı M spl´ac´ı M nespl´ac´ı ˇ spl´ac´ı Z M spl´ac´ı

if pˇr´ıjem = vysok´y & bydliˇstˇe = Praha & pohlav´ı = M then spl´ac´ı

Hled´an´ı pravidla

Chceme naj´ıt nejlepˇs´ı pravidlo pro tˇr´ıdu spl´ ac´ı pˇr´ıjem bydliˇstˇ e vysok´y Praha vysok´y Plzeˇ n n´ızk´y Praha vysok´y Praha stˇredn´ı Brno

pohlav´ı u ´vˇ er M spl´ac´ı M spl´ac´ı M nespl´ac´ı ˇ spl´ac´ı Z M spl´ac´ı

if pˇr´ıjem = vysok´y & bydliˇstˇe = Praha & pohlav´ı = M then spl´ac´ı

Hled´an´ı pravidla

Chceme naj´ıt nejlepˇs´ı pravidlo pro tˇr´ıdu spl´ ac´ı pˇr´ıjem bydliˇstˇ e vysok´y Praha vysok´y Plzeˇ n n´ızk´y Praha vysok´y Praha stˇredn´ı Brno

pohlav´ı u ´vˇ er M spl´ac´ı M spl´ac´ı M nespl´ac´ı ˇ spl´ac´ı Z M spl´ac´ı

if pˇr´ıjem = vysok´y & pohlav´ı = M then spl´ac´ı

Hled´an´ı pravidla

Chceme naj´ıt nejlepˇs´ı pravidlo pro tˇr´ıdu spl´ ac´ı pˇr´ıjem bydliˇstˇ e vysok´y Praha vysok´y Plzeˇ n n´ızk´y Praha vysok´y Praha stˇredn´ı Brno

pohlav´ı u ´vˇ er M spl´ac´ı M spl´ac´ı M nespl´ac´ı ˇ spl´ac´ı Z M spl´ac´ı

if pˇr´ıjem = vysok´y & pohlav´ı = M then spl´ac´ı

Hled´an´ı pravidla

Chceme naj´ıt nejlepˇs´ı pravidlo pro tˇr´ıdu spl´ ac´ı pˇr´ıjem bydliˇstˇ e vysok´y Praha vysok´y Plzeˇ n n´ızk´y Praha vysok´y Praha stˇredn´ı Brno

pohlav´ı u ´vˇ er M spl´ac´ı M spl´ac´ı M nespl´ac´ı ˇ spl´ac´ı Z M spl´ac´ı

if pˇr´ıjem = vysok´y then spl´ac´ı

Hled´an´ı pravidla

Chceme naj´ıt nejlepˇs´ı pravidlo pro tˇr´ıdu spl´ ac´ı pˇr´ıjem bydliˇstˇ e vysok´y Praha vysok´y Plzeˇ n n´ızk´y Praha vysok´y Praha stˇredn´ı Brno

pohlav´ı u ´vˇ er M spl´ac´ı M spl´ac´ı M nespl´ac´ı ˇ spl´ac´ı Z M spl´ac´ı

if pˇr´ıjem = vysok´y then spl´ac´ı

Hled´an´ı pravidla

Chceme naj´ıt nejlepˇs´ı pravidlo pro tˇr´ıdu spl´ ac´ı pˇr´ıjem bydliˇstˇ e vysok´y Praha vysok´y Plzeˇ n n´ızk´y Praha vysok´y Praha stˇredn´ı Brno

pohlav´ı u ´vˇ er M spl´ac´ı M spl´ac´ı M nespl´ac´ı ˇ spl´ac´ı Z M spl´ac´ı

if pˇr´ıjem = vysok´y then spl´ac´ı

Hled´an´ı pravidla

Chceme naj´ıt nejlepˇs´ı pravidlo pro tˇr´ıdu spl´ ac´ı pˇr´ıjem bydliˇstˇ e vysok´y Praha vysok´y Plzeˇ n n´ızk´y Praha vysok´y Praha stˇredn´ı Brno

pohlav´ı u ´vˇ er M spl´ac´ı M spl´ac´ı M nespl´ac´ı ˇ spl´ac´ı Z M spl´ac´ı

if pˇr´ıjem = vysok´y then spl´ac´ı

Zobecˇnov´an´ı podm´ınek

Zobecˇnov´an´ı podm´ınek

Zobecˇnov´an´ı podm´ınek

Zobecˇnov´an´ı podm´ınek

Zobecˇnov´an´ı podm´ınek

Alternativa: specializace podm´ınek

Alternativa: specializace podm´ınek

Nem´a smysl d´ale specializovat.

Specializace bez pˇredem zvolen´eho pˇr´ıkladu

Specializace bez pˇredem zvolen´eho pˇr´ıkladu

Specializace bez pˇredem zvolen´eho pˇr´ıkladu

Mnohem vˇetˇs´ı prohled´avac´ı prostor, ale pravidlo m˚ uˇze b´yt nakonec lepˇs´ı.

Pokr´yvac´ı strategie

pˇr´ıjem vysok´y vysok´y n´ızk´y vysok´y stˇredn´ı

bydliˇstˇ e Praha Plzeˇ n Praha Praha Brno

pohlav´ı M M M ˇ Z M

u ´vˇ er spl´ac´ı spl´ac´ı nespl´ac´ı spl´ac´ı spl´ac´ı

Pokr´yvac´ı strategie

pˇr´ıjem vysok´y vysok´y n´ızk´y vysok´y stˇredn´ı

bydliˇstˇ e Praha Plzeˇ n Praha Praha Brno

pohlav´ı M M M ˇ Z M

u ´vˇ er spl´ac´ı spl´ac´ı nespl´ac´ı spl´ac´ı spl´ac´ı

1. if pˇr´ıjem = vysok´y then spl´ac´ı

Pokr´yvac´ı strategie

pˇr´ıjem vysok´y vysok´y n´ızk´y vysok´y stˇredn´ı

bydliˇstˇ e Praha Plzeˇ n Praha Praha Brno

pohlav´ı M M M ˇ Z M

u ´vˇ er spl´ac´ı spl´ac´ı nespl´ac´ı spl´ac´ı spl´ac´ı

1. if pˇr´ıjem = vysok´y then spl´ac´ı

Pokr´yvac´ı strategie

pˇr´ıjem vysok´y vysok´y n´ızk´y vysok´y stˇredn´ı

bydliˇstˇ e Praha Plzeˇ n Praha Praha Brno

pohlav´ı M M M ˇ Z M

u ´vˇ er spl´ac´ı spl´ac´ı nespl´ac´ı spl´ac´ı spl´ac´ı

1. if pˇr´ıjem = vysok´y then spl´ac´ı 2. if pˇr´ıjem = stˇredn´ı then spl´ac´ı

Pokr´yvac´ı strategie

pˇr´ıjem vysok´y vysok´y n´ızk´y vysok´y stˇredn´ı

bydliˇstˇ e Praha Plzeˇ n Praha Praha Brno

pohlav´ı M M M ˇ Z M

u ´vˇ er spl´ac´ı spl´ac´ı nespl´ac´ı spl´ac´ı spl´ac´ı

1. if pˇr´ıjem = vysok´y then spl´ac´ı 2. if pˇr´ıjem = stˇredn´ı then spl´ac´ı

Pokr´yvac´ı strategie pˇr´ıjem vysok´y vysok´y n´ızk´y vysok´y stˇredn´ı

bydliˇstˇ e Praha Plzeˇ n Praha Praha Brno

pohlav´ı M M M ˇ Z M

u ´vˇ er spl´ac´ı spl´ac´ı nespl´ac´ı spl´ac´ı spl´ac´ı

1. if pˇr´ıjem = vysok´y then spl´ac´ı 2. if pˇr´ıjem = stˇredn´ı then spl´ac´ı

Pokr´yvac´ı strategie 1. Vygeneruj co nejobecnˇejˇs´ı konzistentn´ı pravidlo a vymaˇz pokryt´e pˇr´ıklady. 2. Opakuj krok 1, dokud jsou nˇekter´e pˇr´ıklady nepokryt´e. Tyto kroky postupnˇe uplatni na kaˇzdou tˇr´ıdu.

Separace seznamem pravidel Separace v prostoru dvou re´aln´ych pˇr´ıznak˚ u

Zvolen jeden modr´y pˇr´ıklad

Separace seznamem pravidel Separace v prostoru dvou re´aln´ych pˇr´ıznak˚ u

Zobecnˇen´ı s pouˇz´ıt´ım hraniˇcn´ıch hodnot (pˇredchoz´ı diskretizace)

Separace seznamem pravidel Separace v prostoru dvou re´aln´ych pˇr´ıznak˚ u

Pˇrid´an´ı dalˇs´ıho pravidla

Separace seznamem pravidel Separace v prostoru dvou re´aln´ych pˇr´ıznak˚ u

V´ysledek pokr´yvac´ıho algoritmu

Ne´uplnost klasifikace podle pravidel

I

Nˇekter´e instance seznam pravidel nemus´ı rozhodnout!

I

Narozd´ıl od rozhodovac´ıho stromu

Ne´uplnost klasifikace podle pravidel

I

ˇ s´ı se zaveden´ım implicitn´ıho (default) pravidla Reˇ if true then vˇetˇsinov´a tˇr´ıda

I

kter´e se pouˇzije, pokud podm´ınky ˇz´adn´eho jin´eho pravidla neplat´ı.

Konflikt pravidel

Pravidlo pro modrou tˇr´ıdu

Konflikt pravidel

Potom pravidlo pro zelenou tˇr´ıdu. Pˇrekryt´ı - konflikt!

Konflikt pravidel

Jak seznamem klasifikovat novou instanci?

Konflikt pravidel

Modˇre, protoˇze modr´e pravidlo je v seznamu dˇr´ıv.

Konflikt pravidel

Modˇre, protoˇze modr´e pravidlo je v seznamu dˇr´ıv.

Konflikt pravidel

Pˇri obr´acen´em poˇrad´ı pravidel klasifikujeme instanci zelenˇe.

Konflikt pravidel

Na poˇrad´ı pravidel z´aleˇz´ı!

Konflikt pravidel

D˚ usledek: implicitn´ı pravidlo if true then vˇetˇsinov´a tˇr´ıda vˇzdy na konec seznamu.

Rozhodovac´ı pravidla a asociace

I

Hled´an´ı nejlepˇs´ıch podm´ınek rozhodovac´ıho pravidla je vlastnˇe hled´an´ı ˇcast´ych asociac´ı v dan´e tˇr´ıdˇe instanc´ı. ac´ı if pˇr´ıjem=vysok´y & bydliˇstˇe=praha then spl´ {z } | {z } | ˇ cast´ a asociace

v t´ eto tˇr´ıdˇ e

I

Asociace ≈ konjunkce souˇcasnˇe platn´ych podm´ınek

I

Chceme, aby platila v co nejv´ıce instanc´ıch dan´e tˇr´ıdy a ˇz´adn´e instanci ostatn´ıch tˇr´ıd.

I

Co kdybychom jako tˇr´ıdu ch´apali vˇsechny instance v datech?

I

C´ıl se zjednoduˇs´ı: chceme asociace platn´e v co nejv´ıce instanc´ıch dat.

Life Enjoy

" Life is not a problem to be solved but a reality to be experienced! "

Get in touch

Social

© Copyright 2013 - 2019 TIXPDF.COM - All rights reserved.