Принципы резюмирования больших объемов данных: особенности отбора языковых средств

Авторы

  • Лилия Сакаева

Ключевые слова:

большие объемы данных, естественный язык, лингвистическое резюмирование, слово

Аннотация

Естественный язык является основным способом человека для общения и понимания    явлений     и     процессов.     Ускоренное     внедрение     информационных и коммуникационных технологий во все сферы жизни общества способствует формированию больших объемов данных, содержащих слова, коды, символы и цифры. Однако первоначально   лишь   небольшая   часть   этих   данных   может   быть   понята и использована людьми. Существуют вычислительные методы, которые, используя методы мягких вычислений и естественный язык, строят резюме в виде предложений, описывающих большие объемы данных. Целью данной работы является краткое описание метода, используемого при построении лингвистических резюме, с акцентом на использовании естественного языка для предоставления важной и полной информации о данных. Во- первых, представлен общий обзор лингвистического резюмирования. Затем анализируются два примера применения этого метода к различным базам данных. В обоих случаях получаются короткие предложения на естественном языке, содержащие суммированную информацию о данных. Во втором примере бенефициары показали индекс удовлетворенности по логической схеме Ядова на уровне 0,7.

Библиографические ссылки

Литература

Кузьмина Н.В. Методы исследования педагогической деятельности. Ленинград: Изд-во ЛГУ, 1970.

Pérez I., Santos O., García R., Piñero P., Ramírez E. Discovering linguistic summaries for help in project management // Cuban Journal of Computer Science. Vol. 12. Uciencia, 2018. Pp. 163–175.

Fayyad U. Knowledge Discovery in Databases: An Overview // Relational Data Mining. Berlin, Heidelberg: Springer, 2001. Pp. 28–47.

Yager R.R., Yager R.L. Using linguistic summaries and concepts for understanding large data // Engineering Applications of Artificial Intelligence. No 56. 2016. Pp. 273-280.

Kacprzyk J., Zadrożny S. Queries with Fuzzy Linguistic Quantifiers for Data of Variable Quality Using Some Extended OWA Operators //Advances in Intelligent Systems and Computing. Berlin: Springer. Vol 400. 2016. Pp. 295–305.

Rodríguez C.R. Construction of linguistic summaries of data from criminal processes. Research report (unpublished). Computers and Law Lab at University of Informatics Sciences. Havana, Cuba, 2017. 15 p.

References

Pérez I., Santos O., García R., Piñero P., Ramírez E. (2018). Discovering linguistic summaries for help in project management // Cuban Journal of Computer Science. Vol. 12. Uciencia. Pp. 163–175. (In English)

Fayyad, U. (2001). Knowledge Discovery in Databases: An Overview // Relational Data Mining. Berlin, Heidelberg: Springer. Pp. 28–47. (In English)

Yager, R.R., Yager, R.L. (2016). Using linguistic summaries and concepts for understanding large data // Engineering Applications of Artificial Intelligence. No 56. Pp. 273–280. (In English)

Kacprzyk, J., Zadrożny, S. (2016). Queries with Fuzzy Linguistic Quantifiers for Data of Variable Quality Using Some Extended OWA Operators // Advances in Intelligent Systems and Computing. Vol 400. Cham: Springer. Pp. 295–305. (In English)

Rodríguez, C.R. (2017). Construction of linguistic summaries of data from criminal processes. Research report (unpublished). Computers and Law Lab at University of Informatics Sciences. Havana, Cuba, 15 p. (In English)

Kuzmina, N.V. (1970). Metody issledovania pedagogicheskoi diiatelnosti

[Methods of pedagogical activity research]. Leningrad: Izd-vo LGU. (In Russian)

Загрузки

Опубликован

2019-09-09

Выпуск

Раздел

Лингвистика и межкультурная коммуникация