La communauté e-MarketIngfluence
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
La communauté e-MarketIngfluence


  Bienvenue sur le réseau social e-MarketIngfluence destiné à tous (clients, prestataires, consultants, professeurs, étudiants,...)
  Posez vos questions... Partageons nos connaissances et nos retours d'expérience...
  Bonne visite!

Merci de votre fidélité
N'hésitez pas à parler de cette plateforme d'échanges autour de vous !
Fonction REPUTATION ACTIVEE: La réputation est composée des points liés aux évaluations des posts par les utilisateurs (+ et -) et des points liés à la fonctionnalité « Merci »
Le deal à ne pas rater :
TCL C74 Series 55C743 – TV 55” 4K QLED 144 Hz Google TV (Via ODR ...
499 €
Voir le deal
-23%
Le deal à ne pas rater :
EVGA SuperNOVA 650 G6 – Alimentation PC 100% modulaire 650W, 80+ ...
77.91 € 100.91 €
Voir le deal

Vous n'êtes pas connecté. Connectez-vous ou enregistrez-vous

Analyse automatique de "tonalité" d'un texte ?

4 participants

Aller en bas  Message [Page 1 sur 1]

Joel

Joel
Admin

Bonjour,

Croyez-vous en une solution d'analyse de "tonalité" d'un texte/article sans intervention humaine qui soit réprésentative et statistiquement fiable?

Cordialement,

L'Administrateur

https://emarketingfluence.forumactif.org/

anham

anham

Il existe une littérature abondante sur la question du TAL ou, de manière appliquée au marketing, à la détection de registres. Je vous invite notamment à une lecture régulière de l'excellent http://aixtal.blogspot.com/ tenu par Jean Véronis, professeur à l'Université d'Aix et directeur scientifique de Wikio.

De mon point de vue, les technologies actuelles ne permettent pas, de manière parfaitement automatisée, de rendre compte de la tonalité ou du registre d'un ou plusieurs articles publiés sur le web à l'égard d'une marque. Sans compter la difficulté du TAL à prendre en compte l'ironie, le sarcasme ou encore les sous-entendus, le web pose un problème plus large d'hétérogénéité sémantique. En effet, la détection de registres peut fonctionner correctement sur des ensembles sémantiques homogènes, où l'on sait par exemple qu'avocat désigne la profession et non le fruit, ou que LOL signifie "mort de rire".

En somme, il me semble que la contextualisation (quelles zones du web) et l'orientation (à quelles questions précises veut-on répondre) de la recheche en TAL est des plus nécessaires aujourd'hui. Pour un petit exemple des limites du TAL, je vous invite à jeter un oeil à un billet récemment publié par mes soins : http://linkfluence.net/fr/news/2008/12/28/iphone-vs-blackberry-storm-contre-analyse-dun-buzz/

http://www.pr2peer.net/

3Analyse automatique de "tonalité" d'un texte ? Empty L'AuTonalité ? Ven 6 Fév - 2:40

Joel

Joel
Admin

Merci pour ces pointeurs très intéressants et cette introduction au concept TAL.

J'ai récemment essayé d'aborder l'analyse du ton d'un texte en essayant de trouver une solution semi-automatisée, je vous présente L’AuTonalite.

Ce résultat est le fruit de travaux de recherche par la technique de la "feuille vierge" Smile. Je sais que cela ne sera sans doute jamais 100% fiable car lorsque l’on parle de qualitatif cela requiert à priori une intervention humaine.

Par contre je suis convaincu que statistiquement « l’auto-tonalisation » peut être indicative et même représentative à défaut d’être significative et surtout gratuite.

Je vous laisse découvrir la solution au format Excel (version Microsoft Office System 2007).

Je suis très intéressé par vos commentaires car je suis certain que l'on peut y apporter des améliorations.
Le dictionnaire est personnalisable à souhait.

L'indication de tonalité (POSITIF, NEUTRE, NEGATIF) est pondérée par un %tage de fiabilité.

NB: Merci à Claire GUEDJ, une de mes collaboratrices, qui m'a aidé notamment dans l'affinage de la méthode de calcul statistique de la pondération.

https://emarketingfluence.forumactif.org/

4Analyse automatique de "tonalité" d'un texte ? Empty Dictionnaire de l'AuTonalité Ven 6 Fév - 14:12

Claire



L'auTonalité est un très bel outil, très utile pour l'aide à l'analyse surtout lorsqu'il y a beaucoup d'articles à étudier et pour ressortir des tendances générales ainsi que déceler les articles les plus positifs/négatifs sur un sujet.

Après avoir trouvé le bon système de calcul/pondération, le plus important maintenant je pense est d'étoffer un maximum le dictionnaire pour avoir des résultats qui reflèteraient au mieux la réalité.

Si quelqu'un connaît un site ou une méthode pour compléter le dictionnaire ca m'interesse beaucoup!
Peut-être faire differents champs lexicaux selon le type d'industrie étudié?

PascalJappy



Effectivement, restreindre les textes soumis à une industrie dont de larges lexiques sont fournis est une solution permettant d'améliorer la pertinence de l'analyse. Et des logicels comme ceux proposés par les société Temis (Luxid) et SSPS sont censés faire ça plutôt bien. 01 Info les présente dans un sujet, pour ceux que ça intéresse: http://www.01net.com/editorial/386385/l-analyse-semantique-devient-sentimentale/

Mais je partage l'avis d'anham sur ce sujet. Ce qui a de bonnes chances de fonctionner dans des domaines de publication très normés (communication finnancière, par exemple) échoue encore dans les réseaux sociaux et les publications citoyennes où l'orthographe et la grammaire constituent une première barrière franchissable, mais les effets de style, les formes d'ironie, le sarcasme ... sont hors de portée d'analyse pour les algorithmes actuels.

Pour ceux que ça intéresse, ce livre présente un état de l'art (ardu et peut-être déjà vieillissant): Shannahan / Qu / Wiebe (Eds.): "Computing Attitude and Affect in Text: Theory and Applications". (Springer, 2006) et j'ai une petite bibliographie d'articles en complément. Vous pouvez également tester ces deux sites: http://www.liwc.net/ et http://text0.mib.man.ac.uk:8080/opminpackage/opinion_analysis, qui proposent des outils similaires à celui envoyé par Joel, ci-dessus mais en langue anglaise.

Deux espoirs possibles ?
* Que les erreurs commises au niveau d'un site s'annulent statistiquement. En s'intéressant aux tendances de nombreux sites, les erreurs individuelles dues au style de chaque site sont peut-être moins importantes ?
* Paradoxalement, en s'intéressant à la tonalité par sujet plutôt qu'à la tonalité globale d'un texte, on complexifie le problème mais on le localise peut-être à des zones moins ambigües.
Deux idées naïves et non vérifiées.

Bref, je n'y crois pas trop pour l'instant, mais je ne demande qu'à avoir tort Wink

Pascal

Contenu sponsorisé



Revenir en haut  Message [Page 1 sur 1]

Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum