Bienvenue sur PEBKAC.fr, le site qui recense les anecdotes où l’on se moque des utilisateurs ne maîtrisant pas l’outil informatique. PEBKAC est un acronyme signifiant « Problem Exists Between Keyboard And Chair ».
Le problème se situe entre la chaise et le clavier : soumettez vos histoires, donnez votre avis !
Ce site n'est pas le site original pebkac.fr. Je publie ici la liste des PEBKAC que j'ai pu sauvegarder avant que le site original ne soit mis hors ligne.
Pour un module de notre formation, nous nous retrouvons à traiter une vingtaine de tableaux, tous bâtis sur le même modèle : une cinquantaine de lignes de données, réparties en 5 catégories. Nous devons produire un nuage de points par tableau, mais en pouvant distinguer les différentes catégories et en produisant certaines équations.

Je lance R, importe un premier tableau, et obtiens le résultat voulu en quelques commandes et ajustements. Il n'y a donc plus qu'à faire du copier/coller pour l'appliquer aux autres tableaux. Quinze minutes pour créer le script, quelques minutes pour l'appliquer à l'ensemble des tableaux.

Un de mes collègues me dit de laisser tomber : "R, c'est trop compliqué, Excel c'est plus simple"… Okay, donc nous allons en avoir pour 15 minutes par tableau pour sortir quelque chose d'exploitable. Quant à la "complexité" du logiciel, étant donné que nous avons eu moult cours et travaux pratiques dessus durant l'année, je soupçonne chez ce collègue une tendance au… PEBKAC.
PEBKAC #8203 proposé par Vertical le 24/07/2013 | 28 commentaires | 👍🏽 👎🏽 +119
Tiens, un logiciel que je ne connais pas et qui m'a l'air intéressant. Quelques mots dessus s'il vous plaît ? :)
Commentaire #103225 écrit par mini le 24/07/2013 à 17h34 | 👍🏽 👎🏽
Tout est là : http://www.r-project.org/

Également : https://en.wikipedia.org/wiki/R_%28programming_language%29
Commentaire #103231 écrit par pbx le 24/07/2013 à 17h53 | 👍🏽 👎🏽
On ne dit pas "Je lance R" mais "Je l'enserre".

Sur ce, je ->[].
Commentaire #103232 écrit par Shirluban le 24/07/2013 à 17h54 | 👍🏽 👎🏽
En tout cas ton collègue ne manque pas d'R (enfin si, justement)
Parti rejoindre Shirluban
Commentaire #103239 écrit par ygnobl le 24/07/2013 à 18h41 | 👍🏽 👎🏽
Les plus juniors d'entre nous ne connaissent pas R.
Junior… R… JR…
Je… Heu…
sors
Commentaire #103245 écrit par Ishido le 24/07/2013 à 18h54 | 👍🏽 👎🏽
Aaah R, j'aime ce logiciel <3
S'il pouvait prendre en compte les grosses bases de données, je l'épouserais.

Quoi, on peut pas se marier avec un logiciel ? Mais madame Boutin a dit que ce serait possible si le mariage pour tous était voté !

(Je sais, c'est pas encore trolldi, mais j'ai pas pu me retenir :s )
Commentaire #103254 écrit par Liniel le 24/07/2013 à 19h52 | 👍🏽 👎🏽
Et puis, Excel est un amour à insérer dans un script lambda ! Là où, de ce que j'ai compris, R se lançant en ligne de commandes, on peut le scripter sans soucis. Non ? Ou alors, j'ai mal compris.
Commentaire #103256 écrit par Aaargh!!! le 24/07/2013 à 19h54 | 👍🏽 👎🏽
Ah je sais pas, j'ai pas Excel.
Je ne suis pas sûr d'avoir bien compris ta question, mais : il est possible de réaliser de nombreux scripts pour R, qui dispose d'un langage de programmation similaire (cette comparaison part de ma faible expérience en prog) au JS (while, if ... else if ... else ... et autres structures conditionnelles ; typage automatique des variables...) ; ainsi que d'utiliser des scripts existant déjà.
Commentaire #103263 écrit par Vertical le 24/07/2013 à 20h07 | 👍🏽 👎🏽
Nous sommes d'accord, donc, R est scriptable "de dehors" (un script peut avoir R comme argument), là où c'est très galère pour Excel.
Commentaire #103264 écrit par Aaargh!!! le 24/07/2013 à 20h10 | 👍🏽 👎🏽
@ Aaargh!!! : Là tu me poses une colle... J'ai toujours lancé mes scripts R (le langage) depuis R (le logiciel), soit avec la commande dédiée du logiciel , soit avec un "eval-region" depuis un IDE spécifique à R ; mais je n'ai jamais chreché à savoir si il était possible de faire ce que tu dis.
Le manuel de R semble dire que c'est possible. Du coup, pour le traîtement de données en masse, ça doit être assez pratique...
Commentaire #103265 écrit par Vertical le 24/07/2013 à 20h16 | 👍🏽 👎🏽
Ben oui, c'est ça qui est recherché par certaines personnes, pouvoir "driver" le logiciel à partir de leur propre solution, pour éviter justement de tout devoir traiter sur Excel.

Bon, jvachez vient de passer, je me suis fait moinsser pour délit de dénigrement massif de Excel, zut.
Commentaire #103270 écrit par Aaargh!!! le 24/07/2013 à 20h41 | 👍🏽 👎🏽
Tout dépend de l'utilisation que l'on veut en faire, mais le majeur problème de R, comme d'excel, reste le traitement des grosses bases de données.

Du coup, même si je trouve R plus simple d'utilisation, le mieux quand on veut faire des stats, ça reste SAS. (Dont la licence n'est pas donnée, bien entendu :s )
Commentaire #103273 écrit par Liniel le 24/07/2013 à 20h45 | 👍🏽 👎🏽
Heu, en masse, vite dit.

En tout cas, vu le temps qu'il met pour plusieurs milliers de lignes, je n'ose pas me demander le temps qu'il lui en faudra pour plusieurs dizaines de millions ...
Pour ce que j'en sais, je ne connais aucune entreprise d'assurance qui utilise R pour le traitement des données.
Commentaire #103276 écrit par Liniel le 24/07/2013 à 21h02 | 👍🏽 👎🏽
Je te met des pouces rouges car s'est tout ce que tu mérite.
Commentaire #103278 écrit par JVachez le 24/07/2013 à 21h08 | 👍🏽 👎🏽
Tu veux dire que c'est rapé pour en faire un bon script de traitement des données?
Commentaire #103280 écrit par Daria le 24/07/2013 à 21h20 | 👍🏽 👎🏽
Je ne connais pas la réponse pour tous les langages de programmation, mais je sais qu'il est tout à fait possible (déjà fait) d'insérer du code R dans Perl.

En regardant vite fait sur le net, il semblerait qu'il y ait aussi moyen de se débrouiller avec C++ (il y a un package R pour ça : Rcpp). Pour les autres langages, je ne sais pas.
Commentaire #103287 écrit par zelda84 le 24/07/2013 à 21h35 | 👍🏽 👎🏽
@Daria tout dépend de ce que tu veux en faire. Un script sur plusieurs milliers de lignes, pourquoi pas, et je pense que cela suffira dans la plupart des cas.

Mon record de base de données à traiter est de 150 millions de lignes et une bonne cinquantaine de colonnes, et je fait office de petit joueur à côté d'autres :D

Et dans ces cas, R est loin de suffire.

PS : Pour ceux qui se demandent, la taille des bases de données ou encore le record d'onglet dans un tableur excel, c'est le "qui a la plus grosse" des stagiaires en stats.
Commentaire #103291 écrit par Liniel le 24/07/2013 à 21h55 | 👍🏽 👎🏽
Tu as des bases de données de combien d'individus ? Non parce que pour que SAS soit réellement nécessaire faut vraiment y aller. Il y a des tas de logiciels libres qui permettent de traiter des bases de données assez conséquentes.

Et puis, si tu as bien fait attention au PEBKAC la base de données est vraiment très légère.
Commentaire #103294 écrit par Samael le 24/07/2013 à 22h19 | 👍🏽 👎🏽
D'ailleurs, c'est plus souvent l'ordinateur qui va poser un problème que le logiciel pour le traitement des données.

Je me rappelle qu'en cours, pour nous montrer le fonctionnalité de Tanagra (logiciel libre), le prof nous avait demandé de le faire sur une base de données vraiment importante (je ne sais plus combien de variables) et de toutes les croises entre elles. Ce sont les ordinateurs qui ont eu du mal. Pas le logiciel. Et, avec SAS, cela aurait été pareil.
Commentaire #103295 écrit par Samael le 24/07/2013 à 22h24 | 👍🏽 👎🏽
@Samael la base sur laquelle je travaille en ce moment, c'est environ 70 millions d'individus, donc plutôt conséquent, en tout cas suffisamment pour mettre R à genoux.

Après, je suis d'accord que pour la base de données du PEBKAC, R est le mieux. Par contre, pour un apprentissage, même si on travaille sur des petites bases, où il vaut mieux prendre R, apprendre SAS reste nécessaire.
Parce que dès que tu arrives en entreprise et qu'on te dit que 2 millions d'individus, c'est une petite base (vécu), si tu ne connais que R, ça va être dur.

Pour ce qui est des logiciels libre qui peuvent traiter de gros volumes de données, je n'en connais pas. De ce que j'entends en discutant avec les gens de ma promo, le traitement de données, c'est soit SAS (gros volumes), soit Excel (via VBA). Plus évidemment quelques logiciels pour des besoins spécifiques.
Commentaire #103296 écrit par Liniel le 24/07/2013 à 22h29 | 👍🏽 👎🏽
Un PEBKAC ou j'apprends quelque chose :o bah merci, c'est cool :P
Commentaire #103300 écrit par A-xis le 24/07/2013 à 23h00 | 👍🏽 👎🏽
Tu veux dire que c'est courant d'avoir des bases de plusieurs millions? oO Jamais j'aurais imaginer sa.
Quand tu dis R est loin de suffire ça fait des erreurs, ça plante, ça rame mais ça marche quand-même, ça fait quoi?
Commentaire #103301 écrit par Daria le 24/07/2013 à 23h00 | 👍🏽 👎🏽
S'est pas le premier.
Commentaire #103302 écrit par Daria le 24/07/2013 à 23h01 | 👍🏽 👎🏽
@Daria personne n'a vraiment essayé sur R. Peut-être qu'en fait c'est facile mais que la croyance se transmet de générations en générations ...

Les grosses bases de données, oui, c'est extrêmement courant. Par exemple, si tu as une assurance complémentaire, dès que tu te fait rembourser quelque chose (une consultation, des médicaments, des lunettes, ...), cela ajoute une ligne dans une base de donnée chez ton assureur.
Maintenant, répète l'opération pour plusieurs millions d'assurés, et ce sur plusieurs années, cela fait tout de suite des volumes de données énormes.

Dans la grande distribution, dès que quelqu'un achète avec une carte de fidélité, la liste des achats est intégralement conservée pour servir de base pour des études marketing et de la publicité ciblée.
En faisant les courses une fois par semaine, multiplié par plusieurs millions de clients possédant une carte de fidélité, le volume de données devient gigantesque.

Et ce n'est rien à côté des volumes que Google stocke dans ses serveurs.

Après, cela pose d'autres problèmes, notamment sur la fiabilité des données, sur la complexité du traitement, mais c'est une autre histoire :D
Commentaire #103305 écrit par Liniel le 24/07/2013 à 23h20 | 👍🏽 👎🏽
Grammar Nazi ! Grammar Nazi ! Grammar Nazi !
Commentaire #103309 écrit par mini le 24/07/2013 à 23h37 | 👍🏽 👎🏽
Grammar, Grammar, Grammar Nazi ! Pom pom pom pom !

Excusez-moi : je m'emporte !

Daria, je prends ton S, je t'y suspends comme une vulgaire pièce de viande et je place un joli C à la place !
Commentaire #103319 écrit par Grammar Nazi le 25/07/2013 à 08h29 | 👍🏽 👎🏽
@Aaargh!!! : galère de script pour Excel peut-être, mais pas impossible.
Office 2010 s'interface plutôt bien en PowerShell. Je ne connais pas les commandes et j'imagine bien que c'est plus galère que du R, mais c'est faisable je pense (même si je ne saurais pas faire, ne connaissant pas les cmdlets d'Excel sous PowerShell).
Commentaire #103334 écrit par Woofy le 25/07/2013 à 09h27 | 👍🏽 👎🏽
Daria, tu l'as dans le C.

Shirluban fait une grande fête dehors !
Commentaire #103467 écrit par but2ene le 25/07/2013 à 16h40 | 👍🏽 👎🏽