Exécuter du langage R et Python dans SPSS
Cet atelier se concentre principalement sur le logiciel SPSS et ses options pour exécuter du langage R et du Python à même le logiciel. Le tout est démontré durant l’atelier. Un document numérique est remis aux participants afin qu’ils reproduisent les démonstrations. Ce document comporte les détails de ce qui est survolé.
L’atelier s’adresse à tous les niveaux d’expertise :
- Toute personne qui veut découvrir des langages de programmation, des logiciels et des approches afin d’évaluer ses options en méthodes quantitatives.
- Utilisateur/utilisatrice de SPSS qui veut s’initier à la programmation (exemples en R et Python) et exécuter le code dans le logiciel.
- Cette approche évite la l’apprentissage d’un vrai environnement de programmation avec de nouveaux logiciels et la maitrise de nouveaux processus.C’est peut-être une étape intermédiaire avant de passer à un vrai environnement de programmation pour se libérer des limites imposées par SPSS.
- Toute personne qui utilise R et/ou Python ainsi que SPSS. Le logiciel peut devenir une solution de rechange pour exécuter du code ou une façon de bonifier son travail dans SPSS avec des codes sources R et/ou Python.
Une partie de l’atelier est consacré à un survol des possibilités pour :
- Importer des données en différents formats (format CSV vers R, Python, SPSS, par exemple),
- Importer le format de données natif d’un logiciel dans un autre logiciel (format natif de SPSS vers R ou Python, par exemple),
- Modéliser des données avec différents logiciels et langages,
- Faire un comparatif des logiciels SPSS, RStudio, SAS, STATA et Matlab et leur langages de programmation natifs ou syntaxe pour automatiser des opérations.
- Faire un comparatif des langages R, Python, Julia pour modéliser les données.
- Produire des rapports combinant du code, des résultats de calcul, des graphiques et des cartes à même un texte
Les possibilités de reporting et la qualité des rapports diffèrent grandement entre SPSS, RStudio ou STATA et un notebook Python, par exemple. SPSS se limite à un document primaire de la syntaxe, des résultats de calcul et des commentaires qui entrecoupe la syntaxe. Il faut ensuite coller ce contenu dans un traitement de texte pour éditer un rapport plus abouti. Un notebook mélange traitement de texte avec markdown et code-résultats avec un langage de programmation pour produire un rapport plus étoffé exportable en PDF ou HTML. RStudio ou STATA vont plus loin que les notebooks et donnent des résultats professionnels comme un article en PDF prêt à être publié dans une revue scientifique.
Atelier présenté et animé par Hugues Santerre
Hugues Santerre est consultant et donne des séminaires R (langage R et RStudio) et Python (intro à la base et intro à la science des données) aux Séminaires Informatiques de l’UQAM.
Guides liés: Humanités numériques by Simon Côté-Lapointe