Utehy Research: Hệ thống chia sẻ thông tin phục vụ nghiên cứu khoa học
Tóm tắt:
Trong những năm gần đây, phong trào nghiên cứu khoa học (NCKH) của Trường Đại học Sư phạm
Kỹ thuật (ĐHSPKT) Hưng Yên ngày càng đẩy mạnh. Mỗi năm có hàng trăm bài báo của cán bộ Nhà trường
đăng tải trên các hội thảo, hội nghị, tạp chí khoa học trong và ngoài nước. Đây là nguồn tài liệu tham khảo
rất quan trọng trong NCKH. Tuy nhiên, các tài liệu này chỉ lưu trữ trên máy tính cá nhân, khó khăn trong
việc khai thác thông tin. Trong bài báo này chúng tôi đề xuất hệ thống UTEHY Research hỗ trợ: (1) quản
lý các bài báo khoa học; (2) chia sẻ và khai thác tài liệu NCKH; (3) thống kê các số liệu dựa trên thông
tin các bài báo; (4) cung cấp tin tức, sự kiện về NCKH trong và ngoài trường. Kết quả thực nghiệm tại
đã chỉ ra hệ thống của chúng tôi có thể hỗ trợ hiệu quả cho công tác nghiên
cứu khoa học.
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Tóm tắt nội dung tài liệu: Utehy Research: Hệ thống chia sẻ thông tin phục vụ nghiên cứu khoa học
i báo của cán bộ giảng viên nhà trường nhiều, lớn cung cấp các hệ thống chia sẻ thông tin phục việc xây dựng một thư viện tài nguyên trực tuyến vụ NCKH như: Google Research [1], Microsoft về NCKH càng trở nên cần thiết để cán bộ giảng Research[2], DBLB [3], v.v... Các thông tin được viên có thể tra cứu, tham khảo các bài báo đã có đăng tải trên hệ thống cho phép dễ dàng tìm kiếm, trước đó. tuy nhiên các nguồn tài nguyên hầu hết đều tính Thứ ba, nhiều cán bộ giảng viên đã có kinh phí. Ở các trường Đại học, Cao đẳng Việt Nam, nghiệm nghiên cứu, có nhiều tài liệu tham khảo quý việc triển khai hệ thống chia sẻ thông tin dành riêng giá đã và đang muốn chia sẻ các nguồn tài nguyên cho NCKH hầu hết chỉ mang tính chất nội bộ của đang có cho cán bộ giảng viên khác. Nguồn tài đơn vị, cần sử dụng tài khoản được cấp mới có thể nguyên này có thể lên tới hàng triệu tài liệu, bài sử dụng tài nguyên. Trong bài báo này, chúng tôi báo khoa học, nếu không tổ chức lưu trữ tốt, không đề cập đến việc xây dựng một hệ thống chia sẻ có hệ thống tìm kiếm đủ mạnh thì khó có thể khai thông tin phục vụ nghiên cứu khoa học tại Trường thác được. Chính vì vậy, một hệ thống chia sẻ, hỗ ĐHSPKT Hưng Yên. trợ người dùng đăng tải, tra cứu và khai thác tài liệu Trong những năm gần đây, phong trào tham khảo trong NCKH là rất cần thiết. nghiên cứu khoa học và công nghệ của Nhà trường Ngoài ra, hàng năm theo định kỳ nhà trường ngày càng đẩy mạnh. Trường ĐHSPKT Hưng Yên cũng có những thông báo về tổ chức các sự kiện cần xây dựng một hệ thống chia sẻ các thông tin liên quan đến NCKH như việc đăng nộp bài báo cho phục vụ công tác NCKH nhằm thúc đẩy hoạt động tạp chí của Nhà trường, các đơn vị tổ chức trong và này ngày một phát triển hơn. Tính cấp thiết của hệ ngoài nước. Như vậy, cũng cần có kênh thông tin thống đó được thể hiện qua các khía cạnh sau: chia sẻ các thông tin này cho cán bộ giảng viên của Thứ nhất, hàng năm có hàng trăm bài báo nhà trường. Kênh thông tin này cần được tích hợp của cán bộ nhà trường được đăng tải trên các hội trong một hệ thống mà nhiều cán bộ quan tâm đến thảo, hội nghị, tạp chí khoa học trong và ngoài nước. NCKH sử dụng. Theo đó, nhu cầu quản lý thông tin các bài báo của Chúng tôi đã đề xuất xây dựng một hệ thống cán bộ Phòng Quản lý Khoa học Công nghệ và Hợp website trên nền tảng công nghệ .NET, sử dụng các tác Quốc tế ngày càng trở nên cần thiết để có được công nghệ mới của Microsoft như: ASP.NET 4.5, các số liệu thống kê theo Khoa, theo cán bộ. LINQ. Hệ thống được cài đặt hỗ trợ tìm kiếm Full- Thứ hai, trong nghiên cứu khoa học, nguồn Text trong cơ sở dữ liệu SQL Server – một giải pháp tài liệu tham khảo là hết sức quan trọng. Tuy nhiên, hỗ trợ tìm kiếm mạnh dựa trên thuật toán tìm kiếm trên thực tế, các bài báo khoa học không phải là mờ (Fuzzy Search). Hệ thống được xây dựng trên nguồn tài liệu luôn miễn phí và dễ tìm kiếm. Mỗi cơ sở các thông tin thực tế của các bài báo khoa học, đơn vị nghiên cứu có thể có những thư viện riêng cung cấp nhiều tính năng sau hỗ trợ: cán bộ Phòng Khoa học & Công nghệ - Số 9/Tháng 3 - 2016 Journal of Science and Technology 87 ISSN 2354-0575 Quản lý Khoa học Công nghệ và Hợp tác Quốc tế được tìm thấy. quản lý tốt các bài báo khoa học của cán bộ giảng CONTAINS: Đây là kiểu tìm kiếm sử dụng viên trong toàn trường; giúp các cán bộ giảng viên các phép toán logic “and” hoặc “or”. Khi sử dụng có thể chia sẻ và khai thác tài liệu nghiên cứu khoa kiểu “and”, ví dụ ta tìm với từ khóa “bài báo” thì học theo các lĩnh vực; thống kê báo cáo các số liệu tất cả dữ liệu có nội dung là “bài” và “báo” (có thể về bài báo khoa học theo nhiều tiêu chí; cung cấp rời rạc) sẽ được tìm thấy. Khi ta tìm kiếm theo kiểu các thông tin, sự kiện liên quan đến NCKH trong “or” tất cả dữ liệu có “bài” hoặc “báo”kiểu này gần Nhà trường và các đơn vị ngoài trường. giống với FREETEXT. Phần còn lại của bài báo được tổ chức như sau: chúng tôi sẽ giới thiệu một số kiến thức nền 3. HỆ THỐNG UTEHY RESEARCH tảng liên quan đến vấn đề xây dựng đề tài trong 3.1. Xác định các yêu cầu của hệ thống phần 2. Trong phần 3 chúng tôi trình bày nội dụng Trải qua quá trình khảo sát, phân tích chúng giải pháp xây dựng hệ thống chia sẻ thông tin phục tôi xác định được các yêu cầu của hệ thống dựa vụ NCKH. Phần 4 là các kết quả đạt được và chúng trên hai phân hệ: khai thác tài nguyên và quản lý tôi đưa ra một vài bàn luận. Cuối cùng là chúng tôi tài nguyên. đưa ra kết luận trong phần 5. a) Phân hệ khai thác tài nguyên Là phân hệ được thiết kế dành cho cán bộ 2. Kiến thức nền tảng giảng viên sử dụng hệ thống tra cứu bài báo, tác 2.1. Cấu trúc của một bài báo khoa học giả, tài liệu và cập nhật các tin tức sự kiện NCKH Về nguyên tắc, một bài báo khoa học cần liên quan. đảm bảo bố cục IMRAD (viết tắt lần lượt của: Chức năng tra cứu thông tin: hệ thống cho Introduction, Methods, Results, And, Discussion). phép người dùng tra cứu thông tin một cách nhanh Bố cục này được giới khoa học trong nước và quốc chóng bằng từ khóa dựa vào tiêu đề bài báo hoặc tế chấp nhận rộng rãi vì nó phù hợp với dạng thức tên tác giả. Tra cứu hỗ trợ gợi ý nhanh, tra cứu gần đơn giản nhất và lô-gíc nhất của việc công bố kết đúng không phân biệt Tiếng Việt có dấu, không dấu. quả nghiên cứu khoa học. Tùy vào lĩnh vực nghiên Chức năng xem thông tin: hệ thống cho cứu, vấn đề nghiên cứu và phong cách tác giả, đôi phép người dùng xem các thông tin cơ bản của một khi bố cục trên có thể được đơn giản hóa đi, cụ thể bài báo như được trình bày trong mục 2.1; xem danh hóa thêm, hoặc có những thay đổi về trật tự, hoặc mục bài báo theo lĩnh vực; xem dánh sách bài báo được thể hiện một cách ngầm ẩn nhưng về cơ bản, của một tác giả. Ngoài ra, hệ thống cho phép người một bài báo khoa học cần thể hiện được các yếu tố dùng xem các tin tức sự kiện liên quan đến NCKH. trên [10]. Theo đó, các thuộc tính cơ bản của bài báo Chức năng đăng tải bài báo: hệ thống cho bao gồm: tiêu đề (title), tác giả (authors), tóm tắt phép người dùng có tài khoản được phép đăng, (abstract), từ khóa (keyword), nội dung nghiên cứu quản lý bài báo đã xuất bản. Và có thể tải về các bài (method), tài liệu tham khảo (references). báo trên hệ thống. Chức năng tạo thư viện cá nhân: hệ thống 2.2. Kỹ thuật tìm kiếm toàn văn (Full-Text cho phép người dùng có tài khoản được tạo thư viện Search) các bài báo đã xem. Full-Text Search là tìm kiếm theo chỉ mục Chức năng trình bày nguồn tài nguyên: (Index), để sử dụng tìm kiếm Full-Text ta cần cài hệ thống trình bày danh sách các bài tạp chí của đặt SQL 2008 hoặc phiên bản mới hơn. Ưu điểm Nhà trường, danh sách các bài báo của cán bộ trong của tìm kiếm Full-Text là kết quả tìm kiếm chính trường. xác hơn so với tìm kiếm “like” thông thường, đặc biệt thời gian tìm kiếm tương đối nhanh, phù hợp b) Phân hệ quản lý tài nguyên với những website có hệ thống cơ sở dữ liệu lớn.Ta Phân hệ này được thiết kế các chức năng có thể sử dụng các kiểu tìm kiếm như: FREETEXT, phục vụ việc quản lý các bài báo khoa học, quản lý CONTAINS, FREETABLE, CONTAINSTABLE. người dùng, xét duyệt việc đăng tải các tài liệu của Hệ thống của chúng tôi được xây dựng sử dụng hai người dùng. kiểu tìm kiếm: FREETEXT và CONTAINS trong Chức năng quản lý bài báo: hệ thống thiết Full-Text Search. Áp dụng trong việc tìm kiếm tiêu kế các chức năng cho phép đăng tải bài báo, cập đề bài báo, tên tác giả. nhật thông tin bài báo. FREETEXT: Đây là kiểu tìm kiếm theo kiểu Chức năng quản lý các danh mục: hệ thống fuzzy (tìm kiếm mờ). Full-Text có ưu điểm không thiết kế chức năng cho phép quản lý các danh mục phân biệt tiếng Việt có dấu hay không dấu. Ví dụ như: lĩnh vực nghiên cứu, tạp chí, bài báo, tác giả. khi ta tìm kiếm từ khóa “bai bao” thì “bài báo” cũng Chức năng phê duyệt tài liệu người dùng: 88 Khoa học & Công nghệ - Số 9/Tháng 3 - 2016 Journal of Science and Technology ISSN 2354-0575 hệ thống thiết kế chức năng cho phép quản lý các bài báo, tài liệu khoa học mà người dùng đăng tải. Chức năng quản lý người dùng: hệ thống thiết kế chức năng cho phép tạo mới người dùng và phân quyền sử dụng hệ thống. Trên đây là những chức năng chính của hệ thống UTEHY Research được chúng tôi đề xuất để xây dựng lên hệ thống chia sẻ thông tin phục vụ NCKH tại trường ĐHSPKT Hưng Yên. 3.2. Thiết kế mô hình hệ thống và dữ liệu Hình 1. Mô hình hệ thống UTEHY Research a) Thiết kế mô hình hệ thống Hình 1 dưới đây trình bày mô hình tổng quan b) Thiết kế mô hình dữ liệu của hệ thống UTEHY Research. Trong đó có hai đối Trên cơ sở phân tích kỹ các thông tin liên tượng người dùng là bộ phận quản lý (ADMIN) và quan đến bài báo khoa học, chúng tôi đã thiết kế cơ cán bộ giáo viên (USER). Với cán bộ giảng viên có sở dữ liệu của hệ thống trên hệ quản trị SQL Server thể tra cứu: đọc, tải, tạo thư viện bài báo; đối với để lưu trữ được thông tin của: thông tin tạp chí, lĩnh người quản trị: quản lý toàn bộ thông tin của hệ vực, bài báo, tác giả. Ngoài ra còn lưu trữ các thông thống như: đăng bài báo, quản lý tin tức, thống kê tin về tin tức, sự kiện, tài liệu tham khảo. Một mô báo cáo và một số chức năng khác. hình dữ liệu quan hệ được trình bày trong Hình 2. Hình 2. Mô hình dữ liệu của hệ thống UTEHY Research Khoa học & Công nghệ - Số 9/Tháng 3 - 2016 Journal of Science and Technology 89 ISSN 2354-0575 4. Kết quả nghiên cứu và bàn luận ĐHSPKT Hưng Yên lên đến hàng trăm bài, đóng 4.1. Các kết quả đạt được góp một khối lượng không nhỏ các tài nguyên khoa Chúng tôi đã xây dựng được một hệ thống học. Một hệ thống như UTEHY Research cho việc chia sẻ thông tin phục vụ nghiên cứu khoa học cho lưu trữ và khai thác các tài nguyên cần được triển trường ĐHSPKT Hưng Yên. Hệ thống được triển khai nhân rộng trong các trường đại học, cao đẳng khai trên nền tảng công nghệ .NET, áp dụng các trong toàn quốc. Kết quả đạt được của hệ thống công nghệ mới của Microsoft như: ASP.NET 4.5, UTEHY Research là bước khởi đầu cho việc quản LINQ. Một điểm mạnh của hệ thống là hỗ trợ tra lý và khai thác tài nguyên phục vụ NCKH. cứu, tìm kiếm theo nhiều tiêu chí để khai thác được Trong tương lai, hệ thống chia sẻ thông tin thông tin các bài báo khoa học. Ở đó kỹ thuật tìm phục vụ NCKH sẽ mở rộng với chức năng gợi ý bài kiếm Full-Text trong cơ sở dữ liệu SQL Server – báo và gợi ý cộng tác nghiên cứu. Thứ nhất, chúng một giải pháp hỗ trợ tìm kiếm mạnh dựa trên thuật tôi sẽ tích hợp hệ thống gợi ý các bài báo liên quan toán tìm kiếm mờ (Fuzzy Search) được sử dụng. cho người dùng khi vào xem một bài báo. Kết quả Hệ thống đã áp dụng thử nghiệm trên gợi ý đưa ra được lấy từ cơ sở dữ liệu của hệ thống domain: research.utehy.edu.vn với tập dữ liệu là các dựa trên một giải thuật trích chọn thực thể liên quan bài báo khoa học Số 1, Số 2 của Tạp chí Khoa học & dựa vào tiêu đề, từ khóa. Thứ hai, hệ thống hỗ trợ Công nghệ Trường ĐHSPKT Hưng Yên và các bài gợi ý cộng tác nghiên cứu: trên cơ sở dữ liệu các báo của cán bộ giảng viên Khoa Công nghệ Thông bài báo của hệ thống đã có, áp dụng một giải thuật tin của Nhà trường. Một hệ thống với hai phân hệ: để đánh giá mức độ tương đồng về hướng nghiên khai thác tài nguyên và quản lý tài nguyên với các cứu, từ đó đưa ra gợi ý cộng tác giữa các cho các tính năng chính hỗ trợ quản lý tốt các bài báo khoa nhà nghiên cứu. Đó là hướng mở rộng rất thiết thực học của cán bộ giảng viên trong toàn trường; giúp và tạo lên sức mạnh của hệ thống phục vụ NCKH. các cán bộ giảng viên có thể chia sẻ và khai thác tài liệu nghiên cứu khoa học theo các lĩnh vực; thống 5. Kết luận kê báo cáo các số liệu về bài báo khoa học theo Trong bài báo này chúng tôi đã trình bày nhiều tiêu chí; cung cấp các thông tin, sự kiện liên việc đề xuất một hệ thống chia sẻ thông tin phục vụ quan đến NCKH trong Nhà trường và các đơn vị nghiên cứu khoa học. Đây là một hệ thống với nhiều ngoài trường. tính năng hữu ích, hỗ trợ tốt cho cán bộ giáo viên nói riêng và các nhà nghiên cứu nói chung trong 4.2. Bàn luận việc khai thác các bài báo khoa học. Với các kết quả Như chúng tôi đã trình bày trong phần 1 (Đặt thử nghiệm ban đầu cho thấy hệ thống đã chạy ổn vấn đề), việc xây dựng các hệ thống chia sẻ thông định trên mạng Internet. tin về NCKH đã được nhiều tổ chức lớn thực hiện, Trên cơ sở nghiên cứu đã đạt được, trong thời cung cấp cho các nhà nghiên cứu một kho học liệu gian tới, chúng tôi sẽ phát triển hệ thống UTEHY không lồ như: Google Scholar, Micosoft Research, Research mạnh hơn bằng việc tích hợp hệ thống gợi Tuy nhiên, nhiều bài báo của các hệ thống trên ý bài báo liên quan và gợi ý cộng tác nghiên cứu cần tài khoản tính phí. Trong khi đó, số lượng bài như đã bàn luận ở trên. báo được đăng của cán bộ mỗi trường đại học như Tài liệu tham khảo [1]. Google. (2014, May), Google Scholar, [Online]. [2]. Microsoft. (2014, May), Microsoft Research, [Online]. [3]. DBLP team. (2014, May), DBLP Computer Science Bibliography, [Online]. matik.uni-trier.de/~ley/db/ [4]. Jie Tang, Yutao Zhang, and Huaiyu Wan. (2014, May), Aminer, [Online]. citation [5]. Phạm Hữu Khang, Lập trình ASP.NET 2.0, NXB Lao Động Xã Hội, Hà Nội, Việt Nam, 2005. [6]. Nguyễn Văn Quyết, Công nghệ Web và ứng dụng, Khoa Công nghệ Thông tin - Trường Đại học Sư phạm Kỹ thuật Hưng Yên, Hưng Yên, Việt Nam, 2010. [7]. Paolo Pialorsi and Marco Russo, Programming Microsoft LINQ in Microsoft.NET Framework 4, California, America: Adam Zaremba, 2010. [8]. Matthew MacDonald and Mario Szpuszta, Pro ASP.NET 3.5 in C# 2008, New York, America: Katie Stence, 2007. 90 Khoa học & Công nghệ - Số 9/Tháng 3 - 2016 Journal of Science and Technology ISSN 2354-0575 [9]. Microsoft, (2014, May), Microsoft MSDN, [Online]. ms142571.aspx [10]. Ban biên tập, (2014, May), Đại Học Quốc Gia Hà Nội, [Online]. omy/term/28/2766. UTEHY RESEARCH: INFORMATION SHARING SYSTEM FOR SCIENCE RESEARCHES Abstract: In recent years, the movement of scientific research in Hung Yen University of Technology and Education increasingly promoted. Hundreds of research papers a year were published in the workshops, conferences, journals. These are important resources in scientific research. However, these materials are only stored on personal computers, so it is difficult forinformation exploiting. In this paper, we propose UTEHY Research System: (1) management of scientific articles; (2) sharing and exploitingdocument for research; (3) statistics ofthe data based on information of the papers; (4) providing news and events related to scientific researchboth within and outside school. The experimental results in the address utehy.edu.vn demonstrate that our system can efficiently support for scientific research. Keywords: Publications software management, Articles software management. Khoa học & Công nghệ - Số 9/Tháng 3 - 2016 Journal of Science and Technology 91
File đính kèm:
- utehy_research_he_thong_chia_se_thong_tin_phuc_vu_nghien_cuu.pdf