Introduction
- 1483
- 191
- Noa Faure
Dans les deux derniers articles, nous avons appris à installer et à exécuter GNU R sur le système d'exploitation Linux. Le but de cet article est de fournir un tutoriel de référence rapide à GNU R qui contient une introduction aux principaux objets du langage de programmation R . Nous apprendrons les opérations de base en R, fonctions et variables. De plus, nous introduirons R Data Structures, objets et classes.
Opérations de base en R
Commençons par un exemple mathématique simple. Entrez, par exemple, l'ajout de sept et trois dans votre console R et appuyez sur Entrée, en conséquence, nous obtenons:
> 7 + 3 [1] 10
Pour expliquer plus en détail ce qui vient de se passer et quelle est la terminologie que nous utilisons lors de l'exécution de R, nous disons que le Interpréteur R imprimé un objet retourné par un expression entré dans le Console R. Nous devons également mentionner que R interprète n'importe quel nombre en tant que vecteur. Par conséquent, «[1]» près de notre résultat signifie que l'index de la première valeur affichée dans la ligne donnée est une. Cela peut être clarifié en définissant un vecteur plus long en utilisant le c () fonction. Par exemple:
> C (1: 100) [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 [19] 19 20 21 23 24 25 26 27 28 29 30 31 32 33 34 35 36 [ 37] 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 [55] 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 [73] 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 [91] 91 92 93 94 95 96 97 98 99 100
Il est également possible d'effectuer des opérations sur des vecteurs. Par exemple, nous pouvons ajouter deux vecteurs comme suit:
> C (1,5,67,0) + C (0,1.5,6.7,3) [1] 1.0 6.5 73.7 3.0
Notez que cela signifie ajouter des éléments correspondants de ces deux vecteurs. Si les vecteurs ne sont pas de la même taille, le vecteur plus court est répété plusieurs fois et si la longueur d'objet plus longue n'est pas un multiple de la longueur d'objet plus courte, un message d'avertissement est produit:
> c (1,5,8,9) + c (0, 1.4) [1] 1.0 6.4 8.0 10.4> c (1,5,8,9) + c (0, 1.4,7) [1] 1.0 6.4 15.0 9.0 Message d'avertissement: en C (1, 5, 8, 9) + C (0, 1.4, 7): la longueur d'objet plus longue n'est pas un multiple de longueur d'objet plus court
De plus, nous pouvons définir des vecteurs de caractère en R comme:
> C ("LinuxCareer.com "," r tutoriel ") [1]" LinuxCareer.com "" r tutoriel "
Enfin, pour faire un commentaire au code R, nous utilisons «#». En particulier,
> # Ceci est un commentaire dans le code R
Fonctions et variables
Nous pouvons également définir ou utiliser des fonctions prédéfinies dans R. La plupart des fonctions de R sont construites sous la forme suivante
f (argument1, argument2,…)
Ici «F» est le nom de la fonction et «Argument1, Argument2,…» est la liste des arguments à la fonction. Par exemple, en utilisant certaines fonctions prédéfinies que nous obtenons
> sin (pi / 2) [1] 1> log (3) [1] 1.098612
Contrairement à l'exemple ci-dessus, certaines fonctions de R sont sous la forme d'opérateurs comme l'addition, la puissance, l'égalité, etc. Par exemple, l'opérateur d'égalité produit un résultat de type de données booléen (FALSE / TRUE):
> 4 == 4 [1] Vrai
De même que dans un autre langage de programmation R utilise des variables. L'opérateur d'affectation est ici "<-” (or “=”), for instance
> x x + x [1] 2 8 14
Nous pouvons maintenant nous référer à la troisième valeur du vecteur «x» par
> x [3] [1] 7
ou récupérer uniquement les membres de moins de sept:
> x [x<7] [1] 1 4
Nous pouvons également, par exemple, récupérer les éléments un et trois comme
> x [c (1,3)] [1] 1 7
Enfin, vous pouvez définir les fonctions en R en les nommant simplement en conséquence, puis en les appelant avec ce nom de la même manière que la construction en R Fonctions. Par exemple:
> myfonction myfunction (4,5) [1] 9
Si vous souhaitez voir le code correspondant à une fonction donnée, tapez simplement le nom de la fonction comme
> Fonction MyFunction (x, y) x + y
Structures de données
Comme premier exemple d'une structure de données, nous illustrons comment définir des matrices (tableaux), c'est-à-dire des vecteurs multidimensionnels.
Nous pouvons, par exemple, définir explicitement un tableau comme suit
> a a [, 1] [, 2] [, 3] [, 4] [1,] 1 7 13 19 [2,] 2 8 14 20 [3,] 3 9 15 21 [4,] 4 10 16 22 [5,] 5 11 17 23 [6,] 6 12 18 24
Ou nous pouvons d'abord créer un vecteur et utiliser le matrice() fonction, c'est-à-dire
V m m [, 1] [, 2] [, 3] [, 4] [1,] 1 7 13 19 [2,] 2 8 14 20 [3,] 3 9 15 21 [4,] 4 10 16 22 [ 5,] 5 11 17 23 [6,] 6 12 18 24
Il est également possible de définir plus de tableau bidimensionnel comme
> w w ,, 1 [, 1] [, 2] [1,] 1 4 [2,] 2 5 [3,] 3 6 ,, 2 [, 1] [, 2] [1,] 7 10 [2 ,] 8 11 [3,] 9 12 ,, 3 [, 1] [, 2] [1,] 13 16 [2,] 14 17 [3,] 15 18 ,, 4 [, 1] [, 2] [1,] 19 22 [2,] 20 23 [3,] 21 24
Se référer à une valeur d'une partie d'un tableau est à nouveau simple, par exemple
> w [1,1,1] [1] 1> w [1: 2,1: 2,1] [, 1] [, 2] [1,] 1 4 [2,] 2 5
En omettant les indices, nous obtenons tous les éléments d'une dimension donnée, comme:
> w [, 1,1] [1] 1 2 3
Examinons maintenant les structures de données plus compliquées avec plus d'un type de données sous-jacent. Ces types de données sont appelés listes. Les listes en R peuvent contenir une sélection diverses d'objets de différents types de données. Nous pouvons nommer chaque composant d'une liste, et par conséquent, nous pouvons ensuite nous référer à ce composant par son nom ou son emplacement. Par exemple,
> l L $ name [1] "LinuxCareer.com "$ visiteurs [1]" 10 000 "
Nous pouvons maintenant nous référer aux composants de la liste par nom ou par emplacement comme indiqué ci-dessous
> l $ visiteurs [1] "10 000"> l [1] $ nom [1] "LinuxCareer.com "> l [[1]] [1]" LinuxCareer.com "
UN trame de données est une liste qui contient plusieurs vecteurs nommés avec les mêmes longueurs. C'est une structure similaire à une base de données. Construisons maintenant un cadre de données contenant des taux de change (autres devises / USD):
> Date de devise_090812 DATE_100812 Échange à échange de la devise Date_090812 Date_100812 1 Kroner 6.0611 6.0514 2 Canadien 0 $.9923 0.9917 3 Hong Kong 7 $.7556 7.7569 4 roupies 55.1700 55.1800
Nous pouvons maintenant nous référer à un élément particulier d'un cadre de données par son nom. Par exemple, nous devrons peut-être spécifier le taux de change Hong Kong $ / USD à 090812. Nous pouvons y parvenir de la manière suivante
> Échange $ date_090812 [échangeur $ devise == "Hong Kong $"] [1] 7.7556
Objets et classes
R est un langage de programmation orienté objet. Cela signifie que chaque objet de R a un type et est membre d'une classe. Pour identifier une classe pour un objet donné, nous utilisons la fonction classe() Comme dans l'exemple suivant:
> Classe (échangeur) [1] "Données.frame "> classe (myFunction) [1]" fonction "> classe (1.07) [1] "numérique"
Dans R toutes les fonctions ne sont pas associées à une classe particulière comme dans d'autres langages de programmation orientés objet. Cependant, il existe certaines fonctions qui sont étroitement liées à une classe spécifique. Ceux-ci sont appelés méthodes. Dans R Méthodes appelées fonctions génériques Partagez le même nom pour différentes classes. Cela permet d'appliquer de telles fonctions génériques à des objets de différents types. Par exemple, «-» est une fonction générique pour soustraire les objets. Vous pouvez soustraire les numéros, mais vous pouvez également soustraire le numéro à partir d'une date comme ci-dessous:
> 4-2 [1] 2> comme.Date ("2012-09-08") - 2 [1] "2012-09-06"
Conclusion
L'objectif de ce didacticiel R de base était d'introduire le langage de programmation R aux débutants, qui n'ont jamais utilisé R auparavant. Ce didacticiel peut également être utile comme tutoriel de référence pour ceux qui apprendront des applications plus avancées du logiciel RTATIQUES R. Dans le prochain article, nous décrirons comment définir des modèles statistiques et effectuer une analyse statistique de base avec R. Cela sera combiné avec l'illustration des possibilités graphiques du logiciel R.
Série de tutoriels GNU R:
Partie I: Tutoriels d'introduction à GNU R:
- Introduction à GNU R sur le système d'exploitation Linux
- Exécution de GNU R sur le système d'exploitation Linux
- Un tutoriel rapide sur les opérations de base, les fonctions et les structures de données
- Un tutoriel rapide sur les modèles et graphiques statistiques
- Comment installer et utiliser des packages dans GNU R
- Construire des packages de base à GNU R
Partie II: Langue Gnu r:
- Un aperçu du langage de programmation GNU R
Tutoriels Linux connexes:
- Choses à installer sur Ubuntu 20.04
- Une introduction à l'automatisation Linux, des outils et des techniques
- Masterring Bash Script Loops
- Mint 20: Mieux que Ubuntu et Microsoft Windows?
- Manipulation de Big Data pour le plaisir et le profit Partie 1
- Boucles imbriquées dans les scripts bash
- Choses à faire après l'installation d'Ubuntu 20.04 Focal Fossa Linux
- Choses à installer sur Ubuntu 22.04
- Ubuntu 20.04 astuces et choses que vous ne savez peut-être pas
- Comment doubler Kali Linux et Windows 10