A machine learning approach to product review disambiguation based on function, form and behavior classification

Singh A, Tucker C (2017) A machine learning approach to product review disambiguation based on function, form and behavior classification, Decision Support Systems, Volume 97, May 2017, Pages 81-91

https://www.sciencedirect.com/science/article/pii/S0167923617300477

Mots clés : Apprentissage automatique, Extraction d’attribut de produit, Exploration de texte, Avis sur les produits, La conception des produits

Résumé : Les évaluations de produits en ligne se sont révélées être une source d’informations viable pour aider les clients à prendre des décisions d’achat éclairées. Dans de nombreux cas, les utilisateurs de plateformes d’achat en ligne ont la possibilité d’évaluer les produits sur une échelle numérique et de fournir également des commentaires textuels concernant un produit acheté. Au-delà de l’utilisation de plateformes de revue de produits en ligne comme systèmes d’aide à la décision client, cette source de données riche en informations pourrait également aider les concepteurs qui cherchent à augmenter les chances de succès de leurs produits sur le marché grâce à une meilleure compréhension des besoins du marché. Cependant, la taille et la complexité croissantes des produits sur le marché rendent difficile l’analyse manuelle de ces données. Les informations obtenues à partir de ces sources, si elles ne sont pas exploitées correctement, risquent de déformer le véritable succès / échec d’un. L’objectif de cet article est triple: i) proposer une approche d’apprentissage automatique qui dissipe les commentaires des clients en ligne en les classant en l’une des trois caractéristiques directes du produit (c.-à-d. La forme ,fonction ou comportement ) et deux caractéristiques indirectes du produit (c.-à-d. service et autre ), ii) pour découvrir l’ algorithme d’apprentissage automatique qui donne les résultats les plus élevés et les plus généralisables pour atteindre l’objectif i) et iii) pour quantifier la corrélation entre les évaluations de produits et les évaluations directes et les caractéristiques indirectes du produit. Une étude de cas impliquant des données d’examen pour des produits extraits de sites Web de commerce électronique est présentée pour démontrer la validité de la méthode proposée. Une approche de validation multicouche est présentée pour explorer la généralisation de la méthode proposée. Les contributions scientifiques de ce travail ont le potentiel de transformer la manière dont les concepteurs de produits et les clients intègrent les avis sur les produits dans leurs processus décisionnels en quantifiant la relation entre les avis sur les produits et les caractéristiques des produits.

Grandes lignes :

  • Les évaluations de produits en ligne sont une source d’informations viable pour aider les clients à prendre des décisions d’achat.
  • Elles peuvent aider les concepteurs qui cherchent à augmenter les chances de succès de leurs produits.
  • Classification par apprentissage automatique de la forme, de la fonction et du comportement du produit
  • Précisions de classification d’apprentissage automatique de plus de 82% pour le modèle de base
  • Corrélation entre les évaluations de produits et la forme, la fonction et le comportement des produits
  • La corrélation entre la forme des produits et les notes des produits a donné une valeur de 0,934

[1] N.M.A. Al-Othman, The relationship between online reading rates and performance
on proficiency tests, The Reading Matrix 3 (2003).
[2] N. Archak, A. Ghose, P.G. Ipeirotis, Deriving the pricing power of product features by
mining consumer reviews, Management Science 57 (2011) 1485–1509.
[3] K.J. Arrow, Social Choice and Individual Values, Yale University Press, 2012.
[4] S. Asur, B.A. Huberman, Predicting the future with social media, Web Intelligence
and Intelligent Agent Technology (WI-IAT)2010 IEEE/WIC/ACM International Conference on. IEEE 2010, pp. 492–499.
[5] X. Bai, Predicting consumer sentiments from online text, Decision Support Systems
50 (2011) 732–742.
[6] D.M. Blei, A.Y. Ng, M.I. Jordan, Latent dirichlet allocation, J. Mach. Learn. Res. 3
(2003) 993–1022.
[7] A. Brew, D. Greene, P. Cunningham, Using Crowdsourcing and Active Learning to
Track Sentiment in Online Media, in: Proceedings of the 2010 Conference on ECAI
2010: 19th European Conference on Artificial Intelligence, IOS Press, Amsterdam,
The Netherlands, The Netherlands, 2010 145–150.
[8] K. Dave, S. Lawrence, D.M. Pennock, Mining the peanut gallery: opinion extraction
and semantic classification of product reviews, Proceedings of the 12th International Conference on World Wide Web, ACM 2003, pp. 519–528.
[9] T. Fawcett, ROC graphs: notes and practical considerations for researchers, Mach.
Learn. 31 (2004) 1–38.
[10] O. Feiguina, G. Lapalme, Query-based summarization of customer reviews, Advances
in Artificial Intelligence, Springer 2007, pp. 452–463.
[11] C. Forman, A. Ghose, B. Wiesenfeld, Examining the relationship between reviews
and sales: the role of reviewer identity disclosure in electronic markets, Inf. Syst.
Res. 19 (2008) 291–313.
[12] M. Galkin, D. Mouromtsev, S. Auer, Identifying web tables: supporting a neglected
type of content on the web, International Conference on Knowledge Engineering
and the Semantic Web, Springer 2015, pp. 48–62.
[13] R. Ghani, K. Probst, Y. Liu, M. Krema, A. Fano, Text mining for product attribute extraction, ACM SIGKDD Explorations Newsletter 8 (2006) 41–48.
[14] A. Ghose, P.G. Ipeirotis, Designing novel review ranking systems: predicting the usefulness and impact of reviews, Proceedings of the Ninth International Conference on
Electronic Commerce, ACM 2007, pp. 303–310.
[15] M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann, I.H. Witten, The WEKA
data mining software: an update, ACM SIGKDD Explorations Newsletter 11 (2009)
10–18.
[16] G.A. Hazelrigg, The implications of Arrow’s impossibility theorem on approaches to
optimal engineering design, J. Mech. Des. 118 (1996) 161–164.
[17] B. He, C. Macdonald, J. He, I. Ounis, An effective statistical approach to blog post
opinion retrieval, Proceedings of the 17th ACM Conference on Information and
Knowledge Management, ACM 2008, pp. 1063–1072.
[18] S.S. Htay, K.T. Lynn, Extracting product features and opinion words using pattern
knowledge in customer reviews, Sci. World J. 2013 (2013).
[19] M. Hu, B. Liu, Mining opinion features in customer reviews, AAAI 2004, pp. 755–760.
[20] N. Hu, I. Bose, N.S. Koh, L. Liu, Manipulation of online reviews: an analysis of ratings,
readability, and sentiments, Decis. Support. Syst. 52 (2012) 674–684, http://dx.doi.
org/10.1016/j.dss.2011.11.002.
[21] Import.io|Web Data Platform & Free Web Scraping Tool [WWW Document], n.d.
Import.io. URL https://www.import.io/ (accessed 10.10.16).
[22] Y. Jiang, J. Shang, Y. Liu, Maximizing customer satisfaction through an online recommendation system: a novel associative classification model, Decis. Support Systems
48 (2010) 470–479.
[23] S.W. Kang, C. Tucker, An automated approach to quantifying functional interactions
by mining large-scale product specification data, J. Eng. Des. 0 (2015) 1–24, http://
dx.doi.org/10.1080/09544828.2015.1083539.
[24] S.-M. Kim, P. Pantel, T. Chklovski, M. Pennacchiotti, Automatically assessing review
helpfulness, Proceedings of the 2006 Conference on Empirical Methods in Natural
Language Processing, Association for Computational Linguistics 2006, pp. 423–430.
[25] S. Kotsiantis, Supervised Machine Learning: A Review of Classification Techniques,
2007.
[26] J.R. Landis, G.G. Koch, The measurement of observer agreement for categorical data,
Biometrics (1977) 159–174.
[27] R.Y. Lau, C. Li, S.S. Liao, Social analytics: learning fuzzy product ontologies for aspectoriented sentiment analysis, Decis. Support. Syst. 65 (2014) 80–94.
[28] A.J. Lee, F.-C. Yang, C.-H. Chen, C.-S. Wang, C.-Y. Sun, Mining perceptual maps from
consumer reviews, Decis. Support Syst. 82 (2016) 12–25.
[29] A.J.T. Lee, F.-C. Yang, C.-H. Chen, C.-S. Wang, C.-Y. Sun, Mining perceptual maps from
consumer reviews, Decis. Support. Syst. 82 (2016) 12–25, http://dx.doi.org/10.1016/
j.dss.2015.11.002.
[30] N. Lei, S.K. Moon, A decision support system for market-driven product positioning
and design, Decis. Support. Syst. 69 (2015) 82–91, http://dx.doi.org/10.1016/j.dss.
2014.11.010.
[31] B. Liu, M. Hu, J. Cheng, Opinion Observer: Analyzing and Comparing Opinions on the
Web, Proceedings of the 14th International Conference on World Wide WebACM
2005, pp. 342–351.
[32] H.-M. Lu, Detecting short-term cyclical topic dynamics in the user-generated content and news, Decis. Support. Syst. 70 (2015) 1–14.
[33] S.M. Mudambi, D. Schuff, What Makes a Helpful Review? A Study of Customer Reviews on Amazon.com (SSRN Scholarly Paper No. ID 2175066), Social Science Research Network, Rochester, NY, 2010.
[34] D.L. Olson, D. Delen, Y. Meng, Comparative analysis of data mining methods for
bankruptcy prediction, Decis. Support. Syst. 52 (2012) 464–473.
[35] M.F. Porter, An algorithm for suffix stripping, Program 14 (1980) 130–137.
[36] A. Reyes, P. Rosso, Making objective decisions from subjective data: detecting irony
in customer reviews, Decis. Support. Syst. 53 (2012) 754–760.
[37] S. Rose, N. Hair, M. Clark, Online customer experience: a review of the business-toconsumer online purchase context, Int. J. Manag. Rev. 13 (2011) 24–39.
[38] M.A. Rosenman, J.S. Gero, Purpose and function in design: from the socio-cultural to
the techno-physical, Des. Stud. 19 (1998) 161–186.
[39] N. Salkind, Encyclopedia of Measurement and Statistics, SAGE Publications, Inc.,
2455 Teller Road, Thousand Oaks California 91320 United States, 2007.
[40] A.S. Singh, C.S. Tucker, Investigating the heterogeneity of product feature preferences mined using online product data streams, ASME 2015 International Design
Engineering Technical Conferences and Computers and Information in Engineering
Conference, American Society of Mechanical Engineers, 2015 (p. V02BT03A020-
V02BT03A020).
[41] S. Tuarob, C.S. Tucker, Quantifying product favorability and extracting notable product features using large scale social media data, J. Comput. Inf. Sci. Eng. 15 (2015)
031003.
[42] S. Tuarob, C.S. Tucker, Automated discovery of lead users and latent product features
by mining large scale social media networks, J. Mech. Des. 137 (2015) 071402.
[43] C. Tucker, H. Kim, Predicting emerging product design trend by mining publicly
available customer review data, DS 68-6: Proceedings of the 18th International Conference on Engineering Design (ICED 11), Impacting Society Through Engineering
Design, Vol. 6: Design Information and Knowledge, Lyngby/Copenhagen, Denmark,
15.-19.08. 2011, 2011.
[44] L. Wang, B.D. Youn, S. Azarm, P.K. Kannan, Customer-driven product design selection using web based user-generated content, in: ASME 2011 International Design
Engineering Technical Conferences and Computers and Information in Engineering
Conference, American Society of Mechanical Engineers, 2011 405–419.
[45] Y. Yu, W. Duan, Q. Cao, The impact of social and conventional media on firm equity
value: a sentiment analysis approach, Decis. Support. Syst. 55 (2013) 919–926.
[46] L. Zhuang, F. Jing, X.-Y. Zhu, Movie review mining and summarization, Proceedings
of the 15th ACM International Conference on Information and Knowledge Management, ACM 2006, pp. 43–50.