Category Archives: Twitter

15Juin/20

Bluexml devient partenaire UiPath

Bluexml devient partenaire UiPath et vous accompagne dans l’automatisation de vos processus.

Le RPA avec UiPath, c’est la possibilité d’importants gains de productivité en accélérant de facteurs de 1 à 100 le traitement d’importants volumes de données grâce à la mise en parallèle de nombreux agents robotisés (et non humanoïdes :-). Vos collaraboteurs peuvent alors consacrer leur temps à traiter les cas particuliers  qui réclament un peu de subtilité.

En savoir +

15Juin/20

Bluexml devient partenaire Ephesoft

 

Bluexml devient partenaire ephesoft et vous accompagne dans la dématérialisation de vos documents à l’aide de cette solution, leader de son domaine.

Elue partenaire technologique par Alfresco pour l’année 2019, la solution Ephesoft permet de capturer et enrichir vos documents en lui associant des mots-clés issus du contenu, facilitant son classement et sa réutilisation.

En savoir +

26Mai/20

Retour d’expérience : Le Mans Métropole dématérialise les fiches de synthèse des marchés publics

Afin de faciliter le suivi des marchés publics et donner la possibilité aux différents acteurs de consulter les documents de synthèse des marchés, Le Mans Métropole a développé un outil indépendant des applications métiers.

Le retour d’expérience complet est disponible sur le CLUB.

14Mai/20

L’innovation, une création de valeurs qui profite à tout le monde

L’innovation profite à tout le monde

Une création de valeur pour nos clients

Via nos pratiques d’innovation, nous testons des produits et des technologies afin de trouver la meilleure solution pour répondre aux besoins de nos clients d’un point de vue technique, fonctionnel et budgétaire.

Nous réalisons des études de faisabilité, des prototypes (Proof Of Concept) et tenons à jour une plateforme de démonstration pour leur présenter l’état de l’art dans nos différents domaines d’intervention.

Nous animons également un club utilisateurs (https://connect.bluexml.com) qui rassemble nos clients et leur permet d’échanger autour de leurs expériences. Ces dernières constituent souvent des innovations pour nos clients qui, lors de ces projets de dématérialisation, augmentent généralement leur productivité et améliorent leurs délais de traitement et relations aux usagers.

Une création de valeur pour nos collaborateurs

Travailler sur les mêmes technologies dans les mêmes domaines permet d’accumuler de l’expérience pour produire mieux et plus vite mais génère également de la lassitude. L’innovation est le moyen de limiter celle-ci en permettant à nos collaborateurs d’explorer de nouveaux horizons et garder intact leur motivation. C’est également la possibilité de continuer à apprendre et améliorer son parcours, son expertise.

Nos collaborateurs développent et intègrent des solutions pour répondre aux besoins de nos clients. Cependant, au fur et à mesure de nos projets se dégagent des améliorations par rapport aux premiers projets réalisés. En outre, de nouvelles approches sont testées par l’ensemble du secteur informatique et une veille technique, technologique permanente nous permet d’intégrer ces nouveaux éléments dans nos solutions. Bien sûr, chacun le fait individuellement et acquiert des compétences supplémentaires, mais ce n’est pas simple car il faut trouver le moment d’équilibre qui permette de s’y consacrer entre les délais de production et les dates de livraison à respecter ainsi que les activités de maintenance qui peuvent survenir à tout moment.

Une création de valeur pour Bluexml

Nous positionnons l’innovation au centre des valeurs de Bluexml pour que cela profite au collectif et passe de l’enrichissement personnel à celui de l’entreprise pour la diffuser au client.

Comme on le dit souvent : “Seul, on va plus vite mais, ensemble, on va plus loin”. C’est clairement le cas. Travailler à plusieurs permet de consolider les connaissances par leur confrontation avec les autres mais aussi de les diffuser au sein de Bluexml en les présentant à l’équipe sous forme de vidéos et de blogs. C’est de cette manière qu’elles pourront être réutilisées et maintenues au sein des projets réalisés.

En 2018 et 2019, nous avons ainsi mis en place les Blue Friday, 1/2 journée par semaine, le vendredi après-midi, permettant de se consacrer à l’innovation. Cependant, il n’est pas toujours aisé de se remettre à l’ouvrage toutes les semaines, et, pour peu qu’une contrainte de production survienne, nos collaborateurs reportent rapidement cet investissement pourtant capital. En outre, l’effort dispersé aboutit rarement à un résultat probant.

En 2020, nous avons décidé de regrouper l’activité d’innovation en plusieurs mini-projets permettant de fixer une durée limitée et un périmètre raisonnable, et de les traiter comme de véritables projets : au lieu d’éparpiller notre effort, nous avons pu nous concentrer sur certains investissements qui deviennent visibles sur notre plate-forme de démonstration, pour nos clients mais aussi pour nos services de communication et de vente. En outre, nos collaborateurs ont la satisfaction de démarrer une activité et de la mener à son terme.

Notre démarche et notre pratique évoluent avec le temps et les retours d’expérience acquis. C’est cette dynamique que Bluexml partage avec ses collaborateurs et ses clients, notamment à travers le CLUB (CLub des Utilisateurs de Bluexml).

L’histoire de l’innovation chez Bluexml

  • 2020 : RPA
  • 2019 : Archivage
  • 2018 : Architecture transverse
  • 2017 : BlueCourrier
  • 2016 : Side for Alfresco
  • 2010-2016 : MDA for Alfresco
  • 2009 : MDA for Cocoon
  • 2005-2008 : Cocoon et xml
16Avr/19
/Users/bxml/Desktop/Tmp/Screenshots/Capture d’écran 2019-04-09 à 11.49.26.png

(1/3) Analyse d’une politique documentaire : cas client

Préambule

Ce billet de blog présente le travail réalisé pour un client institutionnel dans le cadre d’une mission d’analyse de leur politique documentaire.

Ce billet se décompose en 3 parties :

  • Présentation de l’objectif, du contexte et de la démarche
  • Présentation de l’étude technique avec une partie des indicateurs obtenus
  • Présentation de l’étude fonctionnelle avec une partie des arborescences

/Users/bxml/Desktop/Tmp/Screenshots/Capture d’écran 2019-04-09 à 11.49.26.png

 

Introduction

L’objectif de l’audit est de réaliser une analyse des contenus stockés dans leur fonds documentaire dans leur totalité (environ 20 To) :

  • un serveur de fichiers Windows, organisationnel (avec les contenus de chaque direction) ;
  • un serveur de fichiers Windows, communs (avec les contenus transverses) ;
  • un serveur de GED Alfresco (avec les contenus collaboratifs).

Cette analyse s’effectue généralement en collaboration avec la DSI et se décompose en 2 parties :

  • une étude technique des contenus stockés sur les différents composants ;
  • une étude fonctionnelle de ces contenus.

Démarche

L’objectif est de lister tous les fichiers contenus dans les systèmes ci-dessus, en récupérant les métadonnées disponibles dans un fichier au format csv. Le nombre de fichiers étant considérable, cette collecte est découpée en plusieurs sous-ensembles afin de ne pas surcharger le système lors de la récupération de ce listing. En outre, afin de pouvoir analyser les contenus extrêmement nombreux (plusieurs millions de ligne), un tableur n’est pas suffisant, il est ainsi prévu d’indexer et rechercher les contenus à l’aide de l’outil spécialisé Elasticsearch (ELK) de la société éponyme.

 

Listing au format csv

Liste des fichiers

Deux scripts ont été écrits en powershell 2 afin de permettre la récupération de ces éléments sur Windows :

  1. Un premier script liste les éléments principaux de premier niveau (c’est à dire les sous-répertoires) du répertoire passé en paramètre et appelle un deuxième script pour chacun des sous-répertoires principaux identifiés ;
  2. Le deuxième script liste tous les fichiers contenus dans le répertoire principal ou un de ses sous-répertoires.

Le premier script pilote le deuxième script. Le premier script a été lancé à la main à des moments propices (soirée, veille de we) pour éviter de trop surcharger le système pendant l’exploitation quotidienne.

Le fichier csv ressemble à ceci :

En parallèle du lancement des scripts de comptage, il faut également lancer la fonction de Windows permettant de compter le nombre et le volume des fichiers et répertoires pour un répertoire donné.

Erreurs

Certaines erreurs apparaissent :

  • répertoires inaccessibles, pour des raisons de droits ;
  • répertoires ou fichiers avec un nom trop long ;
  • répertoires ou fichiers avec des caractères interdits.

Dans l’absolu, il faudrait traiter ces erreurs. Cependant, un comptage a été fait en parallèle par le système Windows et comparé au nombre de répertoires et fichiers trouvés via les scripts ci-dessus. La différence n’est pas significative et on peut simplement ignorer ces erreur.

 

Injection dans le système d’indexation ELK

Le système d’indexation ELK facilite le comptage et le regroupement des données en fonction des indicateurs souhaités afin de faciliter le calcul des éléments techniques mais aussi l’étude du fonds documentaire.

ELK est un système d’indexation de contenus basé sur 3 composants :

  • Logstash pour la récupération et l’analyse des données en amont, en l’occurrence les fichiers csv générés par les scripts précédents ;
  • Elasticsearch, pour l’indexation des données ;
  • Kibana, pour la navigation dans les données.

Traitement et import des données

Logstash permet le traitement et l’import des données afin d’extraire toutes les informations souhaitées. Par exemple, l’extraction de la source de données (Lecteur M: dans notre cas) ou la conversion de la taille des documents en Ko afin de faciliter la lecture. Attention à bien conserver toutes les données afin de pouvoir les réutiliser si nécessaire.

Requête et comptage

Elasticsearch permet la création de requêtes pour extraire et compter le nombre de fichiers comme par exemple compter le nombre de documents par source ou leur taille.

La requête suivante permet par exemple de ne compter que les documents respectant certaines contraintes :

 

Tableaux de bord

Kibana permet la création de tableaux de bords, notamment avec la fonctionnalité TimeLion permettant de calculer et afficher des indicateurs sur le même graphique afin, par exemple, de comparer l’évolution du nombre de documents dans le temps en fonction de leur source.

/Users/bxml/Desktop/Tmp/Screenshots/Capture d’écran 2019-04-08 à 16.48.56.png

 

Comptages des répertoires et fichiers par source

Lorsque tous les éléments ont été injectés dans le moteur d’indexation, on compare alors les éléments obtenus entre le comptage Windows et le comptage ELK afin de vérifier que les erreurs ne sont pas significatives.

 

M:\Organisationnel

Les comptages sont les suivants :

Répertoire principal Nb de répertoires Nb de fichiers Volume
Total comptage listing via le calcul de Windows 1 309 910 10 798 669 16,1 To
Total comptage index 1 305 950 10 171 949 17,1 To

 

N:\Commun

Les comptages sont les suivants :

Répertoire principal Nb de répertoires Nb de fichiers Volume
Total comptage listing via le calcul de Windows 581 770 3 402 133 3,45 To
Total comptage index 564 576 3 089 141 3,64 To

O:\Alfresco

Un lecteur réseau a été monté sur le serveur Alfresco afin de pouvoir lister les fichiers stockés à la racine et dans les sites. Dans notre étude de cas, du fait du faible stockage et du faible nombre des éléments stockés en dehors des sites, qui représentent à peine 10 Go et quelques milliers de fichiers, ils n’ont pas été importés et ont été ignorés dans l’analyse.

Répertoire principal Nb de répertoires Nb de fichiers Volume Remarques
Total comptage index 50 113 295 702 781 Go 115 sites

 

 

Suivez bluexml sur les réseaux sociaux