زبان R برای همه

چند وقت قبل یک مقاله در خصوص استفاده تیم های روزنامه نگاری یکی از رسانه های دنیا از گراف های زبان R بودم...

براساس این گزارش بسیاری از گراف های ساخته شده در این وب سایت خبری با استفاده از بسته ggplot2 در R بوده است.

این تیم روزنامه نگاری برای تمیزکاری و پردازش و نمایش داده ها از R استفاده می کنند.

در یکی از تجربه ها در سال 2017 این تیم برای پردازش 8 میلیون تراکنش از R استفاده کردند. این تیم برای کشف ارتباط داده ها و داستان اعداد از بسته های گرافیکی Rنظیر ggplot2 استفاده کردند. خودم بد جور علاقمند شدم و سعی کردم یکی از این گراف ها رو پیاده سازی کنم:

library(bbplot)
library("ggalt")
library("tidyr")
country <- c("Portugal","Iran","Malaysia","Sweden",
             "Portugal","Iran","Malaysia","Sweden")

year <- c(1996,1996,1996,1996,
          2017,2017,2017,2017)

Rank <- c(39,52,50,20,26,16,23,14)
data2 <- cbind.data.frame(country,year,Rank)
colnames(data2) <-c("Country","Year","Rank")


#Prepare data
dumbbell_df <- data2 %>%
  filter(year == 1996 | year == 2017) %>%
  select(Country, Year, Rank) %>%
  spread(Year, Rank) %>%
  mutate(gap = `2017` - `1996`) %>%
  arrange(desc(gap)) %>%
  head(10)

#Make plot
ggplot(dumbbell_df, aes(x = `1996`, xend = `2017`, y = reorder(Country, gap), group = Country)) + 
  geom_dumbbell(colour = "#dddddd",
                size = 3,
                colour_x = "#FAAB18",
                colour_xend = "#1380A1") +
  bbc_style() + 
  labs(title="Scientific Growth",
       subtitle="Scimago Journal, 1996-2017")

خروجی این کد به صورت زیر هست:

خروجی قطعه کد بالا
خروجی قطعه کد بالا

این رو هم اضافه کنم که داده ها رو از

https://www.scimagojr.com/countryrank.php?year=2017

گرفتم.