علاقه مند به تحلیل داده و داده کاوی. لینکدین:https://www.linkedin.com/in/mohammad-fatehi-09654062/
زبان R برای همه
چند وقت قبل یک مقاله در خصوص استفاده تیم های روزنامه نگاری یکی از رسانه های دنیا از گراف های زبان R بودم...
براساس این گزارش بسیاری از گراف های ساخته شده در این وب سایت خبری با استفاده از بسته ggplot2 در R بوده است.
این تیم روزنامه نگاری برای تمیزکاری و پردازش و نمایش داده ها از R استفاده می کنند.
در یکی از تجربه ها در سال 2017 این تیم برای پردازش 8 میلیون تراکنش از R استفاده کردند. این تیم برای کشف ارتباط داده ها و داستان اعداد از بسته های گرافیکی Rنظیر ggplot2 استفاده کردند. خودم بد جور علاقمند شدم و سعی کردم یکی از این گراف ها رو پیاده سازی کنم:
library(bbplot)
library("ggalt")
library("tidyr")
country <- c("Portugal","Iran","Malaysia","Sweden",
"Portugal","Iran","Malaysia","Sweden")
year <- c(1996,1996,1996,1996,
2017,2017,2017,2017)
Rank <- c(39,52,50,20,26,16,23,14)
data2 <- cbind.data.frame(country,year,Rank)
colnames(data2) <-c("Country","Year","Rank")
#Prepare data
dumbbell_df <- data2 %>%
filter(year == 1996 | year == 2017) %>%
select(Country, Year, Rank) %>%
spread(Year, Rank) %>%
mutate(gap = `2017` - `1996`) %>%
arrange(desc(gap)) %>%
head(10)
#Make plot
ggplot(dumbbell_df, aes(x = `1996`, xend = `2017`, y = reorder(Country, gap), group = Country)) +
geom_dumbbell(colour = "#dddddd",
size = 3,
colour_x = "#FAAB18",
colour_xend = "#1380A1") +
bbc_style() +
labs(title="Scientific Growth",
subtitle="Scimago Journal, 1996-2017")
خروجی این کد به صورت زیر هست:
این رو هم اضافه کنم که داده ها رو از
گرفتم.
مطلبی دیگر از این انتشارات
۶ نوع از اختلالات یادگیری و علائمی که باید بدانید
مطلبی دیگر از این انتشارات
فرصتهایی که در پایگاههای داده مشترک وجود دارد
مطلبی دیگر از این انتشارات
CRISP-DM فرآیند اجرای پروژههای دادهکاوی