Autonomní auta

Zastaralá datová sada s vlastním řízením automobilů svědčí o vývoji strojového učení

Zastaralá datová sada s vlastním řízením automobilů svědčí o vývoji strojového učení


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Jelikož se auta s vlastním pohonem stávají realitou na veřejných silnicích, musí být v obraze všechna data a informace odpovědné za jejich bezpečnou jízdu.

To je důvod, proč, když se rozšířila zpráva, že v široce používaném souboru dat pro samojízdné automobily se objevily štítky stovek chodců, cyklistů, dopravních kuželů, mimo jiné, byla hlavní reakcí starost. Koneckonců, „pravidla silničního provozu“ nezohledňují samořídící auta se slepými skvrnami, které zahrnují i ​​lidi.

Ale ve skutečnosti tomu tak není.

VIZ TÉŽ: JAK FUNGUJÍ AUTOMOBILOVÁ VOZIDLA?

Strojové učení se vyvíjí, ukazují staré datové sady

Z 15,000 ručně zkontrolované obrázky z datové sady Udacity 2, 4,986 z nich, to je 33%podle obchodního poskytovatele datových sad Roboflow.ai nebyly úplné. Ale datové soubory Udacity byly vytvořeny před více než třemi lety a na veřejných ulicích nejsou aktivní.

Je důležité si pamatovat: v internetových letech strojového učení byly tři lidské roky před několika životy.

„V uplynulých letech,“ sdělil Udacity společnosti Interesting Engineering (IE) na výměně e-mailů, „společnosti jako Waymo, nuTonomy a Voyage zveřejnily novější a lepší datové soubory určené pro scénáře reálného světa.“

Jinými slovy, Udacity aktivně nevytvářela nové datové sady, aby držela krok s nejnovější řadou datových sad automobilů s vlastním pohonem, protože - prozatím - přinesla novějším společnostem skutečný svět veřejných ulic.

Strojové učení a algoritmy

Strojové učení pomohlo mnoha průmyslovým odvětvím vyvinout se nad jejich současný stav. Aby tento proces fungoval hladce a bezpečně, je nutné učit počítačové algoritmy dělat nové úkoly. Na dostatečně dlouhé časové ose se tyto datové sady stanou nesmírně složitými. To může lidem na začátku jejich kariéry v oblasti řízení automobilů ztěžovat pochopení. Proto nejsou neúplné datové sady - jako „snadný režim“ ve videohře - špatný nápad. Dokud zůstanou v terénu.

Auta s vlastním pohonem vyžadují pro své algoritmy pro navigaci v nebezpečných situacích na veřejných ulicích spoustu dat. Pokud auto neví, jak rozpoznat lidského chodce, který kráčí po kraji silnice, nebo cyklistu, který sdílí silnici s autem, mohou nastat vážné problémy.

Komerční poskytovatel datových sad, Roboflow, publikoval článek potvrzující, že populární datové sadě pro auto s vlastním pohonem skutečně chybí aktualizace. Dataset Udacity 2 používá tisíce studentů, kteří vytvářejí soubor dat s vlastním pohonem s otevřeným zdrojovým kódem.

Společnost Roboflow to zkontrolovala ručně 15 000 obrázků z datové sady a zjistil to 33% z nich měli problémy. Byly tisíce neoznačených vozidel, stovky neoznačených chodců a desítky neoznačených cyklistů.

Tréninková kolečka pro datové sady automobilů s vlastním řízením

Roboflow možná neměl v úmyslu uvést veřejnost v omyl. Pojem cvičná kola je pro každého obtížné pochopit. Je kolo stále kolo, pokud má dívka na koni dvě kola navíc? Nějaké, ale ne úplně. Zažívá, jaké to je jezdit na kole? Rozhodně, ale bez reálného rizika možného pádu.

Je připravena na skutečnou věc?

Záleží na ní a totéž lze říci o studentech, kteří se musí rozhodnout, zda jsou připraveni sundat cvičná kolečka, a vytvořit si vlastní datové soubory v reálném riziku tohoto odvětví.

Samozřejmě, počínaje datovým souborem Udacity, by tito studenti měli před sebou dlouhou cestu. Chybějící identifikace sledovaná Roboflowem zahrnovala duplikované ohraničující rámečky, nadrozměrné ohraničující rámečky a fantomové anotace.

Aby to bylo komplikované, všude kolem 1.4% obrázků bylo jednoduše neoznačených, přesto obsahovaly automobily, nákladní automobily, světla a dokonce i chodce - jako výzva pro vývojáře datových sad zítřka, aby si sami vyplnili údaje.

To ukazuje, jak neuvěřitelně složité jsou open-source datové sady, a tento rozdíl mezi silnicemi v reálném světě a časnými datovými sadami je zásluhou špičkových společností poskytujících datové sady s vozidly na veřejných komunikacích. Dataset samojízdného vozu Udacity se však na veřejných komunikacích nepoužívá. V současné době je jediný funkční samojízdný vůz společnosti Udacity pouze pro vzdělávací účely a je nastaven na uzavřené zkušební dráze.

Studenti, kteří potřebují cheat-sheet - mají ambici zaplnit díry tříletého souboru dat - mají štěstí: Roboflow soubor dat opravil a znovu vydal zde.

Vzhledem k tomu, že strojové učení tlačí technologii automobilů s vlastním pohonem k vytváření věrnějších datových sad, bude snazší ohlédnout se za ta léta a desetiletí a přemýšlet, jak jsme to zvládli.

Ale stejně jako ta dívka a její kolo - výzva spočívá v demontáži tréninkových kol a v jízdě po veřejných komunikacích.

*** Poznámka editora: Tento článek byl aktualizován - s několika změnami provedenými - po obdržení vysvětlení od Udacity. Předchozí verze tohoto článku naznačovala, že soubory dat o samojízdném vozidle společnosti Udacity byly aktivně používány na veřejných ulicích. To bylo opraveno, aby odráželo skutečnost, že údaje společnosti se používají pouze pro vzdělávací účely a ve skutečnosti nejsou více vadné než „tréninková kolečka“ a slouží pouze k tomu, aby pomohly vývojářům aspirujících datových sad lépe se seznámit s technologií. Společnost Udacity navíc již tři roky nevyvíjí nové datové soubory a „poskytla základ“ novějším a pokročilejším datovým souborům poskytovaným jinými společnostmi, které nejsou členy. Jediný samojízdný vůz Udacity v provozu je navíc výhradně pro vzdělávací účely a pracuje na uzavřené testovací dráze, nikoli na veřejných ulicích. Celkově dřívější verze tohoto článku navrhovala, že neúplné datové sady vyvinuté společností Udacity byly chyby, což je nesprávná interpretace skutečnosti, že se staré datové sady budou přirozeně jevit jako chyby, při zpětném pohledu na budoucí vývoj. Nakonec byl původní název tohoto článku změněn, aby to odrážel. IE tyto chyby lituje.

-IE Redakční ***


Podívejte se na video: Keras Explained (Prosinec 2022).