Google pratar om vikten av öppen källkod och öppna data i ett nyligen blogginlägg

Teknik / Google pratar om vikten av öppen källkod och öppna data i ett nyligen blogginlägg 3 minuter läst

Google



Google som företag har alltid stöttat programvara och data med öppen källkod, åtminstone i deras monter. Det är nästan en trend med stora företag nu eftersom både Google och Microsoft har gjort framstående bidrag till open source-scenen. “ Google är också en stor bidragsgivare till programvara med öppen källkod. Viktiga exempel på detta inkluderar Android , vårt smartphone-operativsystem, Krom , kodbasen för vår Chrome-webbläsare (nu också som driver många konkurrenter ) och TensorFlow , vårt maskininlärningssystem. Googles lansering av Guvernörer ändrat molnhotell för alltid, och har möjliggjort innovation och konkurrens i molnindustrin. Google är också den största bidragsgivaren till öppen källkod till GitHub , ett delat arkiv för programutveckling. År 2017 gjorde Googlers mer än 250 000 ändringar i tiotusentals projekt enbart på GitHub. '

I de flesta fall handlar det inte riktigt om generositet utan mer om att dra nytta av fri utveckling och sedan dra nytta av omfattande adoption. Oavsett har dessa bidrag hjälpt tusentals forskare och har lett framåt mjukvaruutvecklingen på ett enhetligt sätt, vilket bör firas. Google i ett nyligen blogginlägg lyfte fram deras bidrag till öppen data och programvara med öppen källkod.



Med tillkomsten av realtidsspårning och utveckling av förarlösa bilar görs mycket forskning inom datorvision och Google är ett av företagen i framkant inom Visual Tech.



Vårt engagemang för öppen källkod och öppen data har lett oss att dela datamängder, tjänster och programvara med alla. Till exempel släppte Google Öppna bilddatauppsättningen av 36,5 miljoner bilder som innehåller nästan 20 000 kategorier av mänskligt märkta föremål. Med dessa uppgifter kan datorsynforskare utbilda bildigenkänningssystem. På samma sätt har de miljoner kommenterade videorna i YouTube-8M samlingen kan användas för att träna videoigenkänning.



- Variant sak

Chief Economist, Google

Google sitter också på mycket data som kan hjälpa NLP-forskning och hjälpa datorer att bättre förstå mänskligt tal. I blogginlägget markerade Google delningen av en nyckeldatabas med texten “ När det gäller språkbehandling har vi delat Naturliga frågor databas, som innehåller 307.373 mänskliga genererade frågor och svar. Vi har också gjort tillgängliga Billioner Word Corpus , som är baserat på ord som används på offentliga webbsidor, och Ngram Viewer , som kan användas för att utforska de mer än 25 miljoner böckerna i Google Böcker . Dessa samlingar kan användas för statistisk maskinöversättning , taligenkänning, stavningskorrigering , enhetsdetektering, informationsutvinning och annan språkforskning. ”



Sökmotorn är en av Googles kärnverksamheter och får över 63 000 frågor varje sekund. Dessa uppgifter är mycket viktiga för företaget och Google analyserar dessa data för riktad reklam. Ändå offentliggörs vissa insikter i den totala informationen i Googles trenderportal.

' Google erbjuder också Google Trender , en gratis tjänst som gör det möjligt för alla att se och ladda ner aggregerad sökaktivitet sedan 2004 för Google Sök, Bildsökning, Nyhetssökning, Shopping och YouTube. Du kan få sökinformation för länder, regioner, tunnelbanor och städer på månadsbasis, dagligen, och även timvis. Trender-data används i stor utsträckning av forskare inom så varierade områden som medicin och ekonomi. Enligt Google Scholar finns det mer än 21 000 forskningsdokument som citerar Trender som en datakälla. ”

Varför arbeta med projekt med öppen källkod?

Jag pratade kort om detta i början av artikeln. En ny mjukvara kan implementera en bra idé och förnya rummet, men det hindrar inte andra från att implementera liknande idéer och sedan arbeta för att göra det bättre. Många företag har lärt sig det på det hårda sättet, till exempel Windows Phone. Som vi vet var det ett rungande misslyckande och av många anledningar, men att ha en sluten miljö och kontrollera licensiering var en stor del av det. Hardoop och HDFS var versioner av MapReduce med öppna källor som byggdes av Google och företaget lärde sig tidigt vikten av öppen källkod. Sammanfattningsvis är beslutet att göra en öppen källkod för IP en strategisk.

I sitt blogginlägg gräver Google in några andra skäl och säger ' Först och främst är vårt primära uppdrag 'att organisera världens information och göra den universell tillgänglig och användbar.' Visst är ett uppenbart sätt att göra information universellt tillgänglig och användbar att ge bort den ! '

De pratar också om varför de inte kan släppa några saker som säger ' Naturligtvis kan vi inte släppa all information vi använder i vår verksamhet. Vi måste skydda användarnas integritet, behålla sekretessen för företagskunder och skydda Googles egna immateriella rättigheter. Men med förbehåll för sådana överväganden försöker vi i allmänhet göra våra uppgifter så ”allmänt tillgängliga och användbara” som möjligt. '

Taggar Google