Chỉ dẫn trích dẫn - ứng dụng quan trọng của trắc lượng thư mục

Chỉ dẫn trích dẫn (citation index - CI) là chỉ dẫn của các trích dẫn giữa các tài liệu khoa học, cho biết một tài liệu được trích dẫn bao nhiêu lần bởi những tài liệu nào. Bài viết phân tích khái niệm trắc lượng thư mục, chỉ dẫn trích dẫn, ý nghĩa của chỉ dẫn trích dẫn; giới thiệu mô hình thiết kế một chỉ dẫn trích dẫn dưới góc độ lịch sử, cách tiếp cận hiện đại và mô tả mô hình thực tế thông qua cơ sở dữ liệu (CSDL) trích dẫn Scopus; liên hệ với thư viện đại học Việt Nam và đề xuất xây dựng các CSDL trên cơ sở ứng dụng trắc lượng thư mục dưới dạng chỉ dẫn trích dẫn.

1. Trắc lượng thư mục (TLTM)

TLTM được định nghĩa là “áp dụng toán học và các phương pháp thống kê đối với sách và các phương tiện truyền thông khác”. Đôi khi thuật ngữ Statistical Analysis (phân tích thống kê) được sử dụng như một thuật ngữ tương đương (1). TLTM còn có tên gọi là phân tích định lượng hay đo lường ấn phẩm. Bibliometrics có nghĩa đen là “đo lường sách”, nhưng thuật ngữ này được sử dụng cho tất cả các loại tài liệu (đặc biệt với các bài báo/tạp chí). Những gì được đo không phải là các đặc tính vật lý của tài liệu mà là các mẫu thống kê trong các biến số như tác giả, nguồn, chủ đề, nguồn gốc địa lý và trích dẫn... TLTM dựa vào dữ liệu có thể định lượng được trên tài liệu nguồn tin. Ví dụ: tác giả; nguồn gốc: tổ chức, quốc gia, ngôn ngữ; nguồn: tạp chí, nhà xuất bản, loại hình…; nội dung: văn bản, các phần văn bản, chủ đề, lớp phân loại; trích dẫn...

TLTM là ngành khoa học đo đếm các ấn phẩm khoa học và số lượng trích dẫn, qua đó đánh giá chất lượng và tác động của các công trình nghiên cứu khoa học trong mọi lĩnh vực. Cho đến gần đây, các hoạt động TLTM được thực hiện bởi các cán bộ thư viện thường tập trung chủ yếu vào phân tích trích dẫn và đánh giá ảnh hưởng nghiên cứu (2). Trích dẫn, phân tích trích dẫn hình thành nên ý tưởng tạo ra chỉ dẫn trích dẫn. Có thể nói từ những nghiên cứu về phân tích trích dẫn đã dẫn đến những nghiên cứu liên quan mật thiết đến chỉ dẫn trích dẫn.

2. Chỉ dẫn trích dẫn

Để hiểu rõ hơn khái niệm chỉ dẫn trích dẫn, cần phân biệt hai thuật ngữ citation - trích dẫnreference - tham khảo. Derek Price (1986) đã đưa định nghĩa cho cả hai thuật ngữ này như sau: Nếu tài liệu R trích dẫn tài liệu C trong danh mục tài liệu tham khảo trích dẫn (Bibliography), thì R chứa một tham khảo tới C và C có một trích dẫn từ R. Số lượng các tham khảo một tài liệu được đo bởi số mục trong thư mục của nó là danh mục tài liệu tham khảo cuối bài, cuối trang… trong khi số lượng trích dẫn của một tài liệu được tìm thấy bằng cách tra cứu trong một chỉ dẫn trích dẫn, nghĩa là số lượng trích dẫn của một tài liệu cho biết có bao nhiêu tài liệu đề cập đến nó (3).

Chỉ dẫn trích dẫn của một ấn phẩm, do Eugene Garfield đề xuất năm 1955, là số lần một ấn phẩm được trích dẫn, được tham khảo trong tất cả các ấn phẩm khác. Eugene Garfield tạo ra chỉ dẫn trích dẫn khoa học và phát minh ra chỉ số tác động tạp chí IF. Eugene Garfield cho rằng tiềm năng của chỉ mục dựa trên trích dẫn của các tài liệu khoa học làm giảm “trích dẫn thiếu tính phê bình” và một chỉ dẫn như vậy sẽ cho phép các nhà khoa học lần ra “tài liệu nào đã trích dẫn và phê bình các tài liệu khác” (4).

Chỉ dẫn trích dẫn được coi là dấu mốc quan trọng trong lịch sử hình thành và phát triển của TLTM. Hiện nay, chỉ dẫn trích dẫn là một loại CSDL thư mục (hay CSDL trích dẫn), cũng là một chỉ dẫn trích dẫn giữa các ấn phẩm, cho phép người dùng xác định tài liệu sau nào đã trích dẫn tài liệu trước nào (theo wikipedia). Nhờ vậy, thông qua các trích dẫn mà sự kết nối trí tuệ được tạo ra giữa các tài liệu nghiên cứu.

3. Mô hình thiết kế một chỉ dẫn trích dẫn

Một sản phẩm dạng chỉ dẫn trích dẫn có 2 phần cơ bản nhất là: chỉ dẫn nguồn; chỉ dẫn trích dẫn.

Dưới góc độ lịch sử, sản phẩm ứng dụng TLTM quan trọng là chỉ dẫn trích dẫn khoa học của Viện Thông tin Khoa học Mỹ là một loại sản phẩm thư mục đặc biệt đáp ứng nhu cầu thông tin thư mục về tài liệu. Khác với các loại thư mục khác, chỉ dẫn trích dẫn khoa học bao gồm một hệ thống các loại chỉ dẫn cơ bản như: chỉ dẫn trích dẫn, chỉ dẫn nguồn. Đối tượng được mô tả trong chỉ dẫn trích dẫn là các tài liệu được trích dẫn và tương ứng với mỗi tài liệu này là danh sách liệt kê các tài liệu đã trích dẫn đến. Chỉ dẫn trích dẫn khoa học phân loại tài liệu theo nội dung xuất phát từ quan điểm của nhà khoa học khác với các loại sản phẩm thông tin khác khi mà việc phân nhóm tài liệu xuất phát từ quan điểm và sự hiểu biết của cán bộ thông tin thư viện (5).

Chỉ dẫn trích dẫn kết nối các tài liệu được xuất bản trong năm với các tài liệu đã công bố trước (hay tài liệu quá khứ) mà chúng trích dẫn trong danh mục tham khảo; được tổ chứa theo vần abc tác giả được trích dẫn, sử dụng họ của tác giả đầu tiên. Dưới mỗi tác giả được trích dẫn liệt kê theo thứ tự thời gian các tài liệu được trích dẫn của tác giả và dưới mỗi tài liệu được trích dẫn của tác giả liệt kê các nguồn tài liệu đã trích dẫn đến tài liệu đó (6).

Hình 1: Các mục điển hình của chỉ dẫn trích dẫn

Chỉ dẫn nguồn trong Hình 2 được tổ chức theo vần chữ cái abc họ tác giả đầu tiên. Đối với mỗi mục nguồn được liệt kê, có một mô tả thư mục đầy đủ: nhan đề, họ và tên họ viết tắt của tất cả các tác giả, địa chỉ của tác giả đầu tiên, tên, năm, tập, số trang của tạp chí xuất bản, ngôn ngữ trong tài liệu được xuất bản và số lượng tài liệu tham khảo được tạo ra trong mục.

Hình 2: Các mục điển hình của chỉ dẫn nguồn

Chỉ dẫn trích dẫn khoa học chứa một chỉ dẫn nguồn nâng cao, trong đó tất cả tác giả của các bài báo được chỉ mục và ghi lại bởi chỉ dẫn trích dẫn khoa học. Chỉ dẫn này cũng liệt kê nhan đề đầy đủ của mỗi tài liệu. Có thể sử dụng chỉ dẫn nguồn để tìm ra một tác giả đã xuất bản những tài liệu nào. Trong phiên bản điện tử của chỉ dẫn nguồn, các mục cũng bao gồm một danh sách tất cả các tài liệu khác được trích dẫn trong mỗi tài liệu nguồn (7).

Với cách tiếp cận hiện đại, thiết kế sản phẩm chỉ dẫn trích dẫn - một trong những thành tựu ứng dụng quan trọng nhất của TLTM, McVeigh (2017) giải thích rằng “một chỉ dẫn trích dẫn thực sự có hai khía cạnh bao gồm: một chỉ dẫn nguồn được xác định và một chỉ dẫn tham khảo trích dẫn được tiêu chuẩn hóa/thống nhất” (8). Nguyên tắc được McVeigh chỉ ra theo hình 3 dưới đây:

Hình 3: Thiết kế chỉ dẫn trích dẫn theo McVeigh

Hai bài báo 1 và 2 trong chỉ dẫn trích dẫn được gọi là chỉ dẫn nguồn, mô tả thư mục đầy đủ (hay cung cấp siêu dữ liệu) gồm tên tác giả, tên bài báo, tên tạp chí… và danh mục tài liệu tham khảo của bài báo. Vì vậy chỉ dẫn nguồn là những tài liệu được chỉ mục và mô tả một cách toàn diện mà từ đó các tham khảo đã được trích dẫn sẽ được tập hợp lại.

Danh sách các tài liệu tham khảo từ A đến J bắt nguồn từ chỉ dẫn nguồn. Mỗi tài liệu tham khảo này đại diện cho chỉ dẫn tài liệu tham khảo được trích dẫn, có thể trở lại bài báo mà nó xuất hiện (và quay lại chỉ mục nguồn). Do đó, một chỉ dẫn trích dẫn “bắt nguồn từ việc lập chỉ mục gồm hai phần của tài liệu nguồn. Thứ nhất, các mục nhập thư mục được tạo ra cho mỗi mục nguồn; Thứ hai, các tài liệu tham khảo được trích dẫn, được đưa vào một chỉ mục riêng biệt, nơi mà chính các tài liệu tham khảo được hợp nhất. Hai phần trên tạo nên cấu trúc cơ bản của một chỉ dẫn trích dẫn” (9).

4. CSDL trích dẫn Scopus

Giá trị quan trọng của một chỉ dẫn trích dẫn là cho phép người dùng tin biết được một tài liệu được trích dẫn bao nhiêu lần bởi các tài liệu khác. Nhiều CSDL trích dẫn cung cấp các các đường link kết nối tới trang web của các nhà xuất bản để giúp người dùng tin tìm đọc được toàn văn. Vì vậy, người dùng tin không chỉ tra cứu, đọc được thông tin khoa học toàn văn trực tuyến mà còn có thể khai thác, sử dụng các chỉ dẫn trích dẫn để tìm kiếm các tài liệu nghiên cứu có giá trị thông qua số lượng các tài liệu đã trích dẫn đến tài liệu đó.

Hiện nay, các chỉ dẫn trích dẫn chủ yếu là CSDL trích dẫn Web of Science và Scopus, sau đó là Google Schoolar. Đây là 3 là nguồn dữ liệu phổ biến được sử dụng để thực hiện các nghiên cứu TLTM. Các CSDL chỉ dẫn trích dẫn này cung cấp dữ liệu về TLTM, đóng vai trò là kho dữ liệu khổng lồ cho những nghiên cứu về TLTM. Có hai CSDL chỉ dẫn trích dẫn phải đăng ký: Web of Science (thuộc Web of Knowledge) và Scopus. Các chỉ dẫn trích dẫn lớn như Web of Science và Scopus không chỉ cung cấp các dịch vụ chỉ mục, tóm tắt mà còn cung cấp các chức năng phân tích kết quả tìm kiếm nâng cao và giúp người dùng tin xác định các nghiên cứu có ảnh hưởng cao. Trong đó, Web of Science đã ra đời hàng thập kỷ và Scopus mới thành lập bắt đầu từ năm 2004. Có thể coi Google Scholar là chỉ dẫn trích dẫn thứ 3 nhưng không được sử dụng một cách chính thức vì một số lý do sau: không chính xác và dư thừa nhiều biểu ghi; chỉ mục dựa trên yếu tố máy tính hơn là con người nên dẫn đến các vấn đề nghiêm trọng về kiểm soát chất lượng; không đưa ra các phương tiện để tiêu chuẩn hóa kết quả TLTM lý giải cho sự khác biệt trong năm xuất bản, loại tài liệu và lĩnh vực chủ đề; Google Scholar có độ bao quát nguồn tin rộng nhưng dữ liệu ít tin cậy và ít các công cụ TLTM hơn so với Web of Science và Scopus (10).

Trong phạm vi bài viết, tác giả sử dụng CSDL Scopus mô tả một CSDL thư mục được thiết kế theo kiểu một chỉ dẫn trích dẫn (hay CSDL trích dẫn).

Ví dụ: Tìm kiếm tác giả Nguyễn Hữu Đức theo địa chỉ cơ quan Đại học Quốc gia Hà Nội hiển thị 128 tài liệu (có tác giả này là cá nhân hoặc thuộc nhóm tác giả tham gia viết). Cụ thể, chọn Bài tạp chí có nhan đề “Electric field-induced magnetoresistance in spin-valve/piezoelectric multiferroic laminates for low-power spintronics” trong 128 kết quả (lấy thông tin được tra cứu từ CSDL Scopus). Bài tạp chí được mô tả các thông tin thư mục đầy đủ trong CSDL Scopus gồm: Nhan đề, tác giả (nhóm tác giả), năm xuất bản, nhà xuất bản, nguồn (tên tạp chí), quỹ tài trợ (Funding), tóm tắt, từ khóa chủ đề, ISSN, loại nguồn, DOI… danh mục tài liệu tham khảo (gồm 12 tài liệu mà bài tạp chí đã trích dẫn) và chỉ số trích dẫn của bài tạp chí (bài tạp chí được 6 tài liệu đã trích dẫn đến). Cụ thể, trong đó, bài tạp chí trên đã trích dẫn 12 tài liệu (danh mục tài liệu trích dẫn). 12 tài liệu này được chỉ mục và có đường link kết nối đến chúng:

Hình 4: Các tài liệu tham khảo/trích dẫn trong bài tạp chí được chỉ mục trong Scopus

Nói cách khác, bài tạp chí trên có 12 tham khảo và mỗi bài tạp chí trong danh mục 12 tài liệu tham khảo/trích dẫn nhận được 1 trích dẫn của bài tạp chí trên. Từ đó các bài tạp chí kết nối với nhau dựa trên mối quan hệ tham khảo/trích dẫn tạo thành một mạng lưới quan hệ rộng lớn. Trên cơ sở đó, có thể xác định được một tài liệu được bao nhiêu tài liệu trích dẫn đến (chỉ số trích dẫn).

CSDL Scopus thống kê và hiển thị được các tài liệu đã trích dẫn đến nguồn tin (số lượng và các đường link kết nối đến các tài liệu đã trích dẫn).Ví dụ: bài báo “Electric field-induced magnetoresistance in spin-valve/piezoelectric multiferroic laminates for low-power spintronics” đã được trích dẫn bởi 6 tài liệu đã xuất bản trước hay bài tạp chí trên có chỉ số trích dẫn là 6.

Hình 5: Chỉ số trích dẫn của bài tạp chí và 6 tài liệu đã trích dẫn đến

Liên hệ với thư viện đại học Việt Nam

Hiện tại, hầu hết các thư viện đại học tại Việt Nam đang sử dụng CSDL thư mục để tạo lập nguồn tin khoa học. Đây là những CSDL thư mục chứa thông tin thư mục như: nhan đề, tác giả, nhà xuất bản, năm xuất bản, số trang, tóm tắt, từ khóa… về các loại tài liệu và định dạng khác nhau. Tuy nhiên không thể sử dụng các CSDL này cho những nghiên cứu liên quan đến phân tích trích dẫn bởi chúng không chứa dữ liệu trích dẫn. Trong khi đó, CSDL trích dẫn như: Web of Knowledge, Google Scholar và Scopus ngoài các thông tin thư mục cơ bản giống CSDL thư mục còn bao gồm danh sách tài liệu tham khảo được thêm vào biểu ghi thư mục. Danh sách tài liệu tham khảo này còn được gọi là tài liệu tham khảo được trích dẫn hay các trích dẫn. Ngoài việc cho phép tìm kiếm tài liệu khoa học theo chủ đề, CSDL trích dẫn còn cung cấp dữ liệu về số lần trích dẫn nhận được bởi một tài liệu, tác giả, tạp chí nhất định.

Cần có những giải pháp, thiết kế và xây dựng CSDL dạng chỉ dẫn trích dẫn để có thể triển khai ứng dụng các nội dung của TLTM ngoài chức năng kiểm soát quản lý nguồn tin còn có thể thực hiện chức năng thống kê, đánh giá ảnh hưởng/tác động nghiên cứu các chủ thể (từ tài liệu, tác giả, cơ sở giáo dục đại học). Ứng dụng TLTM thể hiện trong các CSDL dạng chỉ dẫn trích dẫn tại các doanh nghiệp thông tin và xuất bản đã tạo ra các loại CSDL có chức năng thực hiện các bài toán thống kê thư mục dựa vào các yếu tố mô tả của tài liệu, đặc biệt là các trích dẫn dựa trên mối quan hệ tham khảo/trích dẫn giữa các tài liệu.

Việc tạo lập các chỉ dẫn trích dẫn chính là xây dựng sản phẩm và dịch vụ thông tin thư viện hiện đại. Từ đó, thư viện đại học Việt Nam có thể thay đổi vai trò và hình ảnh trong việc hỗ trợ hoạt động nghiên cứu và cung cấp dữ liệu phục vụ công tác đánh giá nghiên cứu và xếp hạng khoa học cho hoạt động quản trị đại học.

_______________

1. Pritchard, Alan, Statistical bibliography or bibliometrics (Thư mục thống kê hay trắc lượng thư mục), Tạp chí Documentation, số 25 (4), 1969, tr.348-349.

2. Young, Heartsill, The ALA glossary of library and information science (Từ điển thuật ngữ ALA về khoa học thông tin và thư viện), Nxb Ediciones Díaz de Santos, 1983.

3. Price, Derek J., Little science, big science... and beyond (Khoa học nhỏ, khoa học lớn… và xa hơn thế), Đại học Columbia, Nxb New York, 1986.

4. Garfield, Eugene, Citation indexes for science. A new dimension in documentation through association of ideas (Các chỉ dẫn trích dẫn khoa học: Một chiều hướng mới trong dẫn chứng tài liệu thông qua việc kết hợp các ý tưởng), Tạp chí Quốc tế về dịch tễ học, số 35 (5), 2006, tr.1123-1127.

5. Glanzel, Wolfang, Bibliometrics as a research field a course on theory and application of bibliometric indicators (Trắc lượng thư mục như là một lĩnh vực nghiên cứu: Một khóa học về lý thuyết và ứng dụng chỉ số trắc lượng thư mục), 2003.

6. Garfield, Eugene, The design and production of a citation index (Thiết kế và sản xuất một chỉ dẫn trích dẫn), Tạp chí Công nghệ và nhân văn, 1972, tr.19-36.

7. Garfield, Eugene, Concept of citation indexing: A unique and innovative tool for navigating the research literatüre (Khái niệm chỉ mục trích dẫn: Một công cụ đổi mới và duy nhất để định vị tài liệu nghiên cứu), 1997.

8, 9. Araujo, Paula Carina de, Castanha, Renata Cristina Gutierres, and Hjorland, Birger, Citation indexing and indexes (Chỉ mục và chỉ dẫn trích dẫn), Tổ chức EIKO (Encyclopedia of Knowledge Organization), 2019.

10. Mingers, John and Meyer, Martin, Normalizing Google Scholar data for use in research evaluation (Tiêu chuẩn hóa dữ liệu Google Scholar sử dụng trong đánh giá nghiên cứu), Tạp chí Scientometrics, số 112 (2), 2017, tr.1111-1121.

Tác giả: Nguyễn Thanh Trà

Nguồn: Tạp chí VHNT số 458, tháng 4-2021

;