This dataset contains statistics on names (first names of women, first names of men, and last names) by country of birth. In total, there are 231,505 names by 202 countries. The data comes from Statistics Sweden's population statistics (name register) and refers to persons registered in Sweden on December 31st, 2020. However, some names are excluded due to confidentiality, such as names with fewer than five carriers. The data is licensed with Creative Commons Attribution 4.0 International (CC BY 4.0) and may be used as long as Statistics Sweden is stated as the source. In this dataset, you will also find (in addition to the original data from Statistics Sweden) tidied data where the ISO code for each country has been added, as well as data in so-called wide format and long format to facilitate easier data processing. Please see the Swedish version of the post and the README file for more information about the data.
Detta dataset innehåller statistik över namn (tilltalsnamn på kvinnor, tilltalsnamn på män, samt efternamn) efter födelseland. Totalt är det 231 505 namn uppdelade på 202 länder. Datan kommer från SCB:s befolkningsstatistik/namnregister och avser personer folkbokförda i Sverige 31 december 2020. Vissa namn är dock exkluderade på grund av sekretess, såsom namn med färre än fem bärare. Datan är licensierad med Creative Commons Attribution 4.0 International (CC BY 4.0) och får användas så länge SCB anges som källa. I detta dataset hittar du (förutom originaldatan från SCB) även bearbetningar där ISO-kod för varje land har lagts till samt data i så kallat wide format och long format för att underlätta vidare databehandling. Datatsetet består av följande: namn-efter-fodelseland-2020.xlsx (129 MB) är den obearbetade originalfilen levererad från SCB. Datan är i så kallat wide format med namn på raderna och länderna i kolumnerna. Totalt är det 202 länder plus kolumnen Ospecificerade länder längst till höger. namn-minst-tva-barare-2020.xlsx (12 MB) innehåller namn med minst två bärare 31 december 2020 från SCB. SCB-villkor (0,1 MB) beskriver SCB:s allmänna villkor för avtal och överenskommelser vad gäller användandet av datan. Därtill finns det tre CSV-filer (3,5 MB) där originalfilen har bearbetats till CSV-filer i wide format som underlättar maskinläsning. Vid wide format har originalstrukturen bibehållits med namnen på raderna och länderna i kolumnen. Däremot har länderna ersatts med sina respektive ISO-koder för att undvika problemet med mellanslag och svenska tecken i kolumnnamnen. Det finns även tre ytterligare CSV-filer (141 MB) där originalfilen har bearbetats till CSV-filer i long format som underlättar maskinläsning. Vid long format återupprepas namnet på varje rad för respektive land och det totala antalet bärare för namnet ifråga. Dessutom finns en landskod i ISO-format med varje land för att enkelt kunna integreras i andra typer av analyser.
Total universe/Complete enumerationTotal universe/Complete enumeration
Hela populationen/total räkningHela populationen/total räkning
AggregationAggregation