M =matrix(1:6,3,2)
print(M)

apply(M,2,sum) # sucet jednotlivých stlpcov (2)

apply(M,1,sum) # sucet jednotlivych riadkov (1)

M[3,2]

for(i in 1:dim(M)[2]){
    suma = 0
    for(j in 1:dim(M)[1]){
        suma = suma + M[j,i]
    }
    print(suma)
}

N = matrix(c(1:10, 11:20), 10, 2)  
print(N)

print(apply(N, 1:2, function(x) x/2))

apply(N, 1:2, function(x) x/2)  # porovnajte rozdiel vo vypise - plati len pre jupyter notebook

# lapply vysledok list 
# sapply vysledok vektor/ matica (zjednoduseny lapply)
X = list(a = 1:5, b = 6:10)

X

lapply(X,mean)
sapply(X,mean)

# poznamka: kvantil = hodnota pod ktorou lezi definovana cast udajov - rozmedzie je 0-1
#           kvantil 0,5 je median 
#           kvaRtil =  prvy kvartil 25%  = kvantil 0.25           
#                      druhy kvartil 50% = kvantil 0.5 = median
#                      treti kvartil 75% = kvantil 0.75

lapply(X,quantile)
sapply(X,quantile)

lapply(X,quantile,c(0,0.4,1))
sapply(X,quantile,c(0,0.4,1))

Y = list(a = 1, b = 1:3, c = 10:100) 
Y

lapply(Y,length)  
sapply(Y,length)

lapply(Y,sum)
sapply(Y,sum)

l1 = list(a = c(1:10), b = c(11:20))
l2 = list(c = c(21:30), d = c(31:40))

mapply(sum, l1$a, l1$b, l2$c, l2$d)

mapply(sum,1:5,1:5,1:5) #1,2,3,4,5   1,2,3,4,5    1,2,3,4,5

mapply(rep, 1:4, 6:9) #1,2,3,4     6,7,8,9

x = c(1,2,4,1,5,3,2,1)
x
y = c("ekonometria", "JDA", "ekonometria", "JDA", "SU", "JDA","SU","SU")
y

tapply(x, y, mean)

tapply(x,y,mean,simplify = FALSE)

split(x,y)

fileUrl = "http://people.tuke.sk/peter.butka/res/irisdata.csv"
download.file(fileUrl, destfile = "DATA/iris2.csv")
list.files("DATA")

iris = read.table("DATA/iris.csv", sep = ";",header = TRUE)

# OR
iris1 = read.csv("DATA/iris.csv")          # preco nefunguje?

# OR
iris2 = read.csv2("DATA/iris.csv")

head(iris,20)
tail(iris)

install.packages("curl")
library(jsonlite)

data_json = fromJSON("http://people.tuke.sk/peter.butka/res/data.JSON")   # nacitanie dat

names(data_json)                                                          # vypise names t.j. NAZVY stlpcov data_json 
names(data_json$adresa)                                                   # vypise names t.j. NAZVY, data_json$adresa t.j. stlpcov z ktorych sa sklada adresa

data_json$adresa$mesto                                                    # vypise z tabulky, zo stplca ADRESA, vsetky MESTA

data_json$meno

Cvičenie 2 - Funkcie pre cyklické spracovanie, načítanie dát a práca s knižnicou `dplyr`

Funkcie pre cyklické spracovanie ¶

1. `apply()`¶

2. `lapply()`, `sapply()`¶

3. `mapply()`¶

4. `tapply()`, `split()`¶

Získavanie a načítavanie dát ¶

1. Stiahnutie súborov z webu¶

2. Načítanie lokálnych textových súborov¶

3. JSON súborov¶

Úlohy

Úloha 2.1

Úloha 2.2

Úloha 2.3

Úlohy na precvičenie

Úloha 2.4

Úloha 2.5

Úloha 2.6

Úloha 2.7

Cvičenie 2 - Funkcie pre cyklické spracovanie, načítanie dát a práca s knižnicou dplyr

Funkcie pre cyklické spracovanie ¶

1. apply()¶

2. lapply(), sapply()¶

3. mapply()¶

4. tapply(), split()¶

Získavanie a načítavanie dát ¶

1. Stiahnutie súborov z webu¶

2. Načítanie lokálnych textových súborov¶

3. JSON súborov¶

Úlohy

Úloha 2.1

Úloha 2.2

Úloha 2.3

Úlohy na precvičenie

Úloha 2.4

Úloha 2.5

Úloha 2.6

Úloha 2.7

Cvičenie 2 - Funkcie pre cyklické spracovanie, načítanie dát a práca s knižnicou `dplyr`

1. `apply()`¶

2. `lapply()`, `sapply()`¶

3. `mapply()`¶

4. `tapply()`, `split()`¶