Google erbjuder gratis metadatamängder med få-shot Deep Learning AI och maskininlärningsalgoritmer för snabb och effektiv bildklassificering i TensorFlow och PyTorch

Teknik / Google erbjuder gratis metadatamängder med få-shot Deep Learning AI och maskininlärningsalgoritmer för snabb och effektiv bildklassificering i TensorFlow och PyTorch 2 minuter läst

Google Pixel 5?



Google har tillkännagav tillgängligheten av flera datamängder bestående av olika men begränsade naturliga bilder. Sökjätten är övertygad om att de offentligt tillgängliga uppgifterna kommer att driva takten i Maskininlärning och artificiell intelligens samtidigt som tiden för att utbilda AI-modellerna minskas på en minimal mängd data. Google kallar det nya initiativet 'Free Meta-Datasets' som hjälper AI-modeller att 'lära sig' om mindre data. 'Few-Shot AI' från företaget är optimerat för att säkerställa att AI lär sig nya klasser från endast några få representativa bilder.

Förståelse för behovet av att snabbt utbilda AI- och maskininlärningsmodeller med färre datauppsättningar, Google har lanserat 'Meta-Dataset', en liten samling bilder som skulle bidra till att minska mängden data som behövs för att förbättra algoritmernas noggrannhet. Företaget hävdar att AI- och ML-modellerna kommer att få samma inblick från mycket färre representativa bilder med hjälp av få bildbildsklassificeringstekniker.



Google AI tillkännager metadatamängden: En datamängd med datamängder för få-inlärning:

Deep Learning för AI och maskininlärning har ökat exponentiellt under ganska lång tid. Kärnkravet är dock tillgången på högkvalitativa data och det också i stora mängder. De stora mängderna av manuellt kommenterade träningsdata är ofta svåra att skaffa och kan ibland vara opålitliga också. Förstå riskerna med stora datamängder har Google meddelat att det finns en samling metadatamängder.



Genom ' Metadatamängd: En datamängd med datamängder för att lära sig att lära av några exempel ”(Presenteras vid ICLR 2020 ), Har Google föreslagit ett storskaligt och mångsidigt riktmärke för att mäta kompetensen hos olika bildklassificeringsmodeller i en realistisk och utmanande få-shot-miljö, och erbjuder ett ramverk där man kan undersöka flera viktiga aspekter av få-shot-klassificering. I huvudsak erbjuder Google 10 allmänt tillgängliga och kostnadsfria datauppsättningar av naturliga bilder. Dessa datamängder består av ImageNet, CUB-200-2011, Fungi, handskrivna karaktärer och klotter. Koden är offentlig och inkluderar en anteckningsbok som visar hur Meta-dataset kan användas i TensorFlow och PyTorch .



Few-shot klassificering går utöver standardutbildning och djupinlärningsmodeller . Det tar generalisering till helt nya klasser vid testtiden. Med andra ord sågs bilderna som användes under testningen inte under träningen. I klassificeringen med några skott innehåller träningssatsen klasser som är helt oskiljaktiga från de som kommer att visas vid testtiden. Varje testuppgift innehåller en supportuppsättning av några märkta bilder från vilka modellen kan lära sig om de nya klasserna och en ojämnhet frågeset av exempel som modellen sedan ombeds klassificera.

En metadatamängd är en stor komponent där modellen studerar generalisering till helt nya datamängder , från vilka inga bilder från någon klass sågs under träningen. Detta är ett tillägg till den tuffa generaliseringsutmaningen för nya klasser som är inbyggda i inställningarna för inlärning med få bilder.

Hur hjälper metadatauppsättningen till djupinlärning för AI- och maskininlärningsmodeller?

Meta-dataset representerar det största skalade organiserade riktmärket för klassificering av korsdatauppsättningar med få bilder hittills. Det introducerar också en samplingsalgoritm för att generera uppgifter med olika egenskaper och svårigheter, genom att variera antalet klasser i varje uppgift, antalet tillgängliga exempel per klass, införa klassobalanser och, för vissa datamängder, variera graden av likhet mellan klasser för varje uppgift.



Meta-Dataset introducerar nya utmaningar för klassificering med få skott. Googles forskning är fortfarande preliminär och det finns mycket mark att täcka. Sökjätten har dock hävdat att forskare upplever framgång. Några av de anmärkningsvärda exemplen inkluderar att använda smart designade uppgift konditionering , mer sofistikerad inställning av hyperparameter , till ' meta-baslinje ”Som kombinerar fördelarna med förutbildning och metalärande och slutligen användning val av funktioner att specialisera en universell representation för varje uppgift.

Taggar Google