Utehy Research: Hệ thống chia sẻ thông tin phục vụ nghiên cứu khoa học

Tóm tắt:

Trong những năm gần đây, phong trào nghiên cứu khoa học (NCKH) của Trường Đại học Sư phạm

Kỹ thuật (ĐHSPKT) Hưng Yên ngày càng đẩy mạnh. Mỗi năm có hàng trăm bài báo của cán bộ Nhà trường

đăng tải trên các hội thảo, hội nghị, tạp chí khoa học trong và ngoài nước. Đây là nguồn tài liệu tham khảo

rất quan trọng trong NCKH. Tuy nhiên, các tài liệu này chỉ lưu trữ trên máy tính cá nhân, khó khăn trong

việc khai thác thông tin. Trong bài báo này chúng tôi đề xuất hệ thống UTEHY Research hỗ trợ: (1) quản

lý các bài báo khoa học; (2) chia sẻ và khai thác tài liệu NCKH; (3) thống kê các số liệu dựa trên thông

tin các bài báo; (4) cung cấp tin tức, sự kiện về NCKH trong và ngoài trường. Kết quả thực nghiệm tại

 đã chỉ ra hệ thống của chúng tôi có thể hỗ trợ hiệu quả cho công tác nghiên

cứu khoa học.

Utehy Research: Hệ thống chia sẻ thông tin phục vụ nghiên cứu khoa học trang 1

Trang 1

Utehy Research: Hệ thống chia sẻ thông tin phục vụ nghiên cứu khoa học trang 2

Trang 2

Utehy Research: Hệ thống chia sẻ thông tin phục vụ nghiên cứu khoa học trang 3

Trang 3

Utehy Research: Hệ thống chia sẻ thông tin phục vụ nghiên cứu khoa học trang 4

Trang 4

Utehy Research: Hệ thống chia sẻ thông tin phục vụ nghiên cứu khoa học trang 5

Trang 5

pdf 5 trang xuanhieu 3480
Bạn đang xem tài liệu "Utehy Research: Hệ thống chia sẻ thông tin phục vụ nghiên cứu khoa học", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Utehy Research: Hệ thống chia sẻ thông tin phục vụ nghiên cứu khoa học

Utehy Research: Hệ thống chia sẻ thông tin phục vụ nghiên cứu khoa học
i báo của cán bộ giảng viên nhà trường nhiều, 
lớn cung cấp các hệ thống chia sẻ thông tin phục việc xây dựng một thư viện tài nguyên trực tuyến 
vụ NCKH như: Google Research [1], Microsoft về NCKH càng trở nên cần thiết để cán bộ giảng 
Research[2], DBLB [3], v.v... Các thông tin được viên có thể tra cứu, tham khảo các bài báo đã có 
đăng tải trên hệ thống cho phép dễ dàng tìm kiếm, trước đó.
tuy nhiên các nguồn tài nguyên hầu hết đều tính Thứ ba, nhiều cán bộ giảng viên đã có kinh 
phí. Ở các trường Đại học, Cao đẳng Việt Nam, nghiệm nghiên cứu, có nhiều tài liệu tham khảo quý 
việc triển khai hệ thống chia sẻ thông tin dành riêng giá đã và đang muốn chia sẻ các nguồn tài nguyên 
cho NCKH hầu hết chỉ mang tính chất nội bộ của đang có cho cán bộ giảng viên khác. Nguồn tài 
đơn vị, cần sử dụng tài khoản được cấp mới có thể nguyên này có thể lên tới hàng triệu tài liệu, bài 
sử dụng tài nguyên. Trong bài báo này, chúng tôi báo khoa học, nếu không tổ chức lưu trữ tốt, không 
đề cập đến việc xây dựng một hệ thống chia sẻ có hệ thống tìm kiếm đủ mạnh thì khó có thể khai 
thông tin phục vụ nghiên cứu khoa học tại Trường thác được. Chính vì vậy, một hệ thống chia sẻ, hỗ 
ĐHSPKT Hưng Yên. trợ người dùng đăng tải, tra cứu và khai thác tài liệu 
 Trong những năm gần đây, phong trào tham khảo trong NCKH là rất cần thiết.
nghiên cứu khoa học và công nghệ của Nhà trường Ngoài ra, hàng năm theo định kỳ nhà trường 
ngày càng đẩy mạnh. Trường ĐHSPKT Hưng Yên cũng có những thông báo về tổ chức các sự kiện 
cần xây dựng một hệ thống chia sẻ các thông tin liên quan đến NCKH như việc đăng nộp bài báo cho 
phục vụ công tác NCKH nhằm thúc đẩy hoạt động tạp chí của Nhà trường, các đơn vị tổ chức trong và 
này ngày một phát triển hơn. Tính cấp thiết của hệ ngoài nước. Như vậy, cũng cần có kênh thông tin 
thống đó được thể hiện qua các khía cạnh sau: chia sẻ các thông tin này cho cán bộ giảng viên của 
 Thứ nhất, hàng năm có hàng trăm bài báo nhà trường. Kênh thông tin này cần được tích hợp 
của cán bộ nhà trường được đăng tải trên các hội trong một hệ thống mà nhiều cán bộ quan tâm đến 
thảo, hội nghị, tạp chí khoa học trong và ngoài nước. NCKH sử dụng.
Theo đó, nhu cầu quản lý thông tin các bài báo của Chúng tôi đã đề xuất xây dựng một hệ thống 
cán bộ Phòng Quản lý Khoa học Công nghệ và Hợp website trên nền tảng công nghệ .NET, sử dụng các 
tác Quốc tế ngày càng trở nên cần thiết để có được công nghệ mới của Microsoft như: ASP.NET 4.5, 
các số liệu thống kê theo Khoa, theo cán bộ. LINQ. Hệ thống được cài đặt hỗ trợ tìm kiếm Full-
 Thứ hai, trong nghiên cứu khoa học, nguồn Text trong cơ sở dữ liệu SQL Server – một giải pháp 
tài liệu tham khảo là hết sức quan trọng. Tuy nhiên, hỗ trợ tìm kiếm mạnh dựa trên thuật toán tìm kiếm 
trên thực tế, các bài báo khoa học không phải là mờ (Fuzzy Search). Hệ thống được xây dựng trên 
nguồn tài liệu luôn miễn phí và dễ tìm kiếm. Mỗi cơ sở các thông tin thực tế của các bài báo khoa học, 
đơn vị nghiên cứu có thể có những thư viện riêng cung cấp nhiều tính năng sau hỗ trợ: cán bộ Phòng 
Khoa học & Công nghệ - Số 9/Tháng 3 - 2016 Journal of Science and Technology 87
ISSN 2354-0575
Quản lý Khoa học Công nghệ và Hợp tác Quốc tế được tìm thấy.
quản lý tốt các bài báo khoa học của cán bộ giảng CONTAINS: Đây là kiểu tìm kiếm sử dụng 
viên trong toàn trường; giúp các cán bộ giảng viên các phép toán logic “and” hoặc “or”. Khi sử dụng 
có thể chia sẻ và khai thác tài liệu nghiên cứu khoa kiểu “and”, ví dụ ta tìm với từ khóa “bài báo” thì 
học theo các lĩnh vực; thống kê báo cáo các số liệu tất cả dữ liệu có nội dung là “bài” và “báo” (có thể 
về bài báo khoa học theo nhiều tiêu chí; cung cấp rời rạc) sẽ được tìm thấy. Khi ta tìm kiếm theo kiểu 
các thông tin, sự kiện liên quan đến NCKH trong “or” tất cả dữ liệu có “bài” hoặc “báo”kiểu này gần 
Nhà trường và các đơn vị ngoài trường. giống với FREETEXT.
 Phần còn lại của bài báo được tổ chức như 
sau: chúng tôi sẽ giới thiệu một số kiến thức nền 3. HỆ THỐNG UTEHY RESEARCH
tảng liên quan đến vấn đề xây dựng đề tài trong 3.1. Xác định các yêu cầu của hệ thống
phần 2. Trong phần 3 chúng tôi trình bày nội dụng Trải qua quá trình khảo sát, phân tích chúng 
giải pháp xây dựng hệ thống chia sẻ thông tin phục tôi xác định được các yêu cầu của hệ thống dựa 
vụ NCKH. Phần 4 là các kết quả đạt được và chúng trên hai phân hệ: khai thác tài nguyên và quản lý 
tôi đưa ra một vài bàn luận. Cuối cùng là chúng tôi tài nguyên.
đưa ra kết luận trong phần 5. a) Phân hệ khai thác tài nguyên
 Là phân hệ được thiết kế dành cho cán bộ 
2. Kiến thức nền tảng giảng viên sử dụng hệ thống tra cứu bài báo, tác 
2.1. Cấu trúc của một bài báo khoa học giả, tài liệu và cập nhật các tin tức sự kiện NCKH 
 Về nguyên tắc, một bài báo khoa học cần liên quan.
đảm bảo bố cục IMRAD (viết tắt lần lượt của: Chức năng tra cứu thông tin: hệ thống cho 
Introduction, Methods, Results, And, Discussion). phép người dùng tra cứu thông tin một cách nhanh 
Bố cục này được giới khoa học trong nước và quốc chóng bằng từ khóa dựa vào tiêu đề bài báo hoặc 
tế chấp nhận rộng rãi vì nó phù hợp với dạng thức tên tác giả. Tra cứu hỗ trợ gợi ý nhanh, tra cứu gần 
đơn giản nhất và lô-gíc nhất của việc công bố kết đúng không phân biệt Tiếng Việt có dấu, không dấu.
quả nghiên cứu khoa học. Tùy vào lĩnh vực nghiên Chức năng xem thông tin: hệ thống cho 
cứu, vấn đề nghiên cứu và phong cách tác giả, đôi phép người dùng xem các thông tin cơ bản của một 
khi bố cục trên có thể được đơn giản hóa đi, cụ thể bài báo như được trình bày trong mục 2.1; xem danh 
hóa thêm, hoặc có những thay đổi về trật tự, hoặc mục bài báo theo lĩnh vực; xem dánh sách bài báo 
được thể hiện một cách ngầm ẩn nhưng về cơ bản, của một tác giả. Ngoài ra, hệ thống cho phép người 
một bài báo khoa học cần thể hiện được các yếu tố dùng xem các tin tức sự kiện liên quan đến NCKH.
trên [10]. Theo đó, các thuộc tính cơ bản của bài báo Chức năng đăng tải bài báo: hệ thống cho 
bao gồm: tiêu đề (title), tác giả (authors), tóm tắt phép người dùng có tài khoản được phép đăng, 
(abstract), từ khóa (keyword), nội dung nghiên cứu quản lý bài báo đã xuất bản. Và có thể tải về các bài 
(method), tài liệu tham khảo (references). báo trên hệ thống.
 Chức năng tạo thư viện cá nhân: hệ thống 
2.2. Kỹ thuật tìm kiếm toàn văn (Full-Text cho phép người dùng có tài khoản được tạo thư viện 
Search) các bài báo đã xem.
 Full-Text Search là tìm kiếm theo chỉ mục Chức năng trình bày nguồn tài nguyên: 
(Index), để sử dụng tìm kiếm Full-Text ta cần cài hệ thống trình bày danh sách các bài tạp chí của 
đặt SQL 2008 hoặc phiên bản mới hơn. Ưu điểm Nhà trường, danh sách các bài báo của cán bộ trong 
của tìm kiếm Full-Text là kết quả tìm kiếm chính trường.
xác hơn so với tìm kiếm “like” thông thường, đặc 
biệt thời gian tìm kiếm tương đối nhanh, phù hợp b) Phân hệ quản lý tài nguyên
với những website có hệ thống cơ sở dữ liệu lớn.Ta Phân hệ này được thiết kế các chức năng 
có thể sử dụng các kiểu tìm kiếm như: FREETEXT, phục vụ việc quản lý các bài báo khoa học, quản lý 
CONTAINS, FREETABLE, CONTAINSTABLE. người dùng, xét duyệt việc đăng tải các tài liệu của 
Hệ thống của chúng tôi được xây dựng sử dụng hai người dùng.
kiểu tìm kiếm: FREETEXT và CONTAINS trong Chức năng quản lý bài báo: hệ thống thiết 
Full-Text Search. Áp dụng trong việc tìm kiếm tiêu kế các chức năng cho phép đăng tải bài báo, cập 
đề bài báo, tên tác giả. nhật thông tin bài báo.
 FREETEXT: Đây là kiểu tìm kiếm theo kiểu Chức năng quản lý các danh mục: hệ thống 
fuzzy (tìm kiếm mờ). Full-Text có ưu điểm không thiết kế chức năng cho phép quản lý các danh mục 
phân biệt tiếng Việt có dấu hay không dấu. Ví dụ như: lĩnh vực nghiên cứu, tạp chí, bài báo, tác giả.
khi ta tìm kiếm từ khóa “bai bao” thì “bài báo” cũng Chức năng phê duyệt tài liệu người dùng: 
88 Khoa học & Công nghệ - Số 9/Tháng 3 - 2016 Journal of Science and Technology
 ISSN 2354-0575
hệ thống thiết kế chức năng cho phép quản lý các 
bài báo, tài liệu khoa học mà người dùng đăng tải.
 Chức năng quản lý người dùng: hệ thống 
thiết kế chức năng cho phép tạo mới người dùng và 
phân quyền sử dụng hệ thống.
 Trên đây là những chức năng chính của hệ 
thống UTEHY Research được chúng tôi đề xuất để 
xây dựng lên hệ thống chia sẻ thông tin phục vụ 
NCKH tại trường ĐHSPKT Hưng Yên.
3.2. Thiết kế mô hình hệ thống và dữ liệu Hình 1. Mô hình hệ thống UTEHY Research
a) Thiết kế mô hình hệ thống
 Hình 1 dưới đây trình bày mô hình tổng quan b) Thiết kế mô hình dữ liệu
của hệ thống UTEHY Research. Trong đó có hai đối Trên cơ sở phân tích kỹ các thông tin liên 
tượng người dùng là bộ phận quản lý (ADMIN) và quan đến bài báo khoa học, chúng tôi đã thiết kế cơ 
cán bộ giáo viên (USER). Với cán bộ giảng viên có sở dữ liệu của hệ thống trên hệ quản trị SQL Server 
thể tra cứu: đọc, tải, tạo thư viện bài báo; đối với để lưu trữ được thông tin của: thông tin tạp chí, lĩnh 
người quản trị: quản lý toàn bộ thông tin của hệ vực, bài báo, tác giả. Ngoài ra còn lưu trữ các thông 
thống như: đăng bài báo, quản lý tin tức, thống kê tin về tin tức, sự kiện, tài liệu tham khảo. Một mô 
báo cáo và một số chức năng khác. hình dữ liệu quan hệ được trình bày trong Hình 2.
 Hình 2. Mô hình dữ liệu của hệ thống UTEHY Research
Khoa học & Công nghệ - Số 9/Tháng 3 - 2016 Journal of Science and Technology 89
ISSN 2354-0575
4. Kết quả nghiên cứu và bàn luận ĐHSPKT Hưng Yên lên đến hàng trăm bài, đóng 
4.1. Các kết quả đạt được góp một khối lượng không nhỏ các tài nguyên khoa 
 Chúng tôi đã xây dựng được một hệ thống học. Một hệ thống như UTEHY Research cho việc 
chia sẻ thông tin phục vụ nghiên cứu khoa học cho lưu trữ và khai thác các tài nguyên cần được triển 
trường ĐHSPKT Hưng Yên. Hệ thống được triển khai nhân rộng trong các trường đại học, cao đẳng 
khai trên nền tảng công nghệ .NET, áp dụng các trong toàn quốc. Kết quả đạt được của hệ thống 
công nghệ mới của Microsoft như: ASP.NET 4.5, UTEHY Research là bước khởi đầu cho việc quản 
LINQ. Một điểm mạnh của hệ thống là hỗ trợ tra lý và khai thác tài nguyên phục vụ NCKH. 
cứu, tìm kiếm theo nhiều tiêu chí để khai thác được Trong tương lai, hệ thống chia sẻ thông tin 
thông tin các bài báo khoa học. Ở đó kỹ thuật tìm phục vụ NCKH sẽ mở rộng với chức năng gợi ý bài 
kiếm Full-Text trong cơ sở dữ liệu SQL Server – báo và gợi ý cộng tác nghiên cứu. Thứ nhất, chúng 
một giải pháp hỗ trợ tìm kiếm mạnh dựa trên thuật tôi sẽ tích hợp hệ thống gợi ý các bài báo liên quan 
toán tìm kiếm mờ (Fuzzy Search) được sử dụng. cho người dùng khi vào xem một bài báo. Kết quả 
 Hệ thống đã áp dụng thử nghiệm trên gợi ý đưa ra được lấy từ cơ sở dữ liệu của hệ thống 
domain: research.utehy.edu.vn với tập dữ liệu là các dựa trên một giải thuật trích chọn thực thể liên quan 
bài báo khoa học Số 1, Số 2 của Tạp chí Khoa học & dựa vào tiêu đề, từ khóa. Thứ hai, hệ thống hỗ trợ 
Công nghệ Trường ĐHSPKT Hưng Yên và các bài gợi ý cộng tác nghiên cứu: trên cơ sở dữ liệu các 
báo của cán bộ giảng viên Khoa Công nghệ Thông bài báo của hệ thống đã có, áp dụng một giải thuật 
tin của Nhà trường. Một hệ thống với hai phân hệ: để đánh giá mức độ tương đồng về hướng nghiên 
khai thác tài nguyên và quản lý tài nguyên với các cứu, từ đó đưa ra gợi ý cộng tác giữa các cho các 
tính năng chính hỗ trợ quản lý tốt các bài báo khoa nhà nghiên cứu. Đó là hướng mở rộng rất thiết thực 
học của cán bộ giảng viên trong toàn trường; giúp và tạo lên sức mạnh của hệ thống phục vụ NCKH.
các cán bộ giảng viên có thể chia sẻ và khai thác tài 
liệu nghiên cứu khoa học theo các lĩnh vực; thống 5. Kết luận
kê báo cáo các số liệu về bài báo khoa học theo Trong bài báo này chúng tôi đã trình bày 
nhiều tiêu chí; cung cấp các thông tin, sự kiện liên việc đề xuất một hệ thống chia sẻ thông tin phục vụ 
quan đến NCKH trong Nhà trường và các đơn vị nghiên cứu khoa học. Đây là một hệ thống với nhiều 
ngoài trường. tính năng hữu ích, hỗ trợ tốt cho cán bộ giáo viên 
 nói riêng và các nhà nghiên cứu nói chung trong 
4.2. Bàn luận việc khai thác các bài báo khoa học. Với các kết quả 
 Như chúng tôi đã trình bày trong phần 1 (Đặt thử nghiệm ban đầu cho thấy hệ thống đã chạy ổn 
vấn đề), việc xây dựng các hệ thống chia sẻ thông định trên mạng Internet.
tin về NCKH đã được nhiều tổ chức lớn thực hiện, Trên cơ sở nghiên cứu đã đạt được, trong thời 
cung cấp cho các nhà nghiên cứu một kho học liệu gian tới, chúng tôi sẽ phát triển hệ thống UTEHY 
không lồ như: Google Scholar, Micosoft Research, Research mạnh hơn bằng việc tích hợp hệ thống gợi 
 Tuy nhiên, nhiều bài báo của các hệ thống trên ý bài báo liên quan và gợi ý cộng tác nghiên cứu 
cần tài khoản tính phí. Trong khi đó, số lượng bài như đã bàn luận ở trên.
báo được đăng của cán bộ mỗi trường đại học như 
Tài liệu tham khảo
 [1]. Google. (2014, May), Google Scholar, [Online]. 
 [2]. Microsoft. (2014, May), Microsoft Research, [Online]. 
 [3]. DBLP team. (2014, May), DBLP Computer Science Bibliography, [Online]. 
 matik.uni-trier.de/~ley/db/
 [4]. Jie Tang, Yutao Zhang, and Huaiyu Wan. (2014, May), Aminer, [Online]. 
 citation
 [5]. Phạm Hữu Khang, Lập trình ASP.NET 2.0, NXB Lao Động Xã Hội, Hà Nội, Việt Nam, 2005.
 [6]. Nguyễn Văn Quyết, Công nghệ Web và ứng dụng, Khoa Công nghệ Thông tin - Trường Đại học 
 Sư phạm Kỹ thuật Hưng Yên, Hưng Yên, Việt Nam, 2010.
 [7]. Paolo Pialorsi and Marco Russo, Programming Microsoft LINQ in Microsoft.NET Framework 
 4, California, America: Adam Zaremba, 2010.
 [8]. Matthew MacDonald and Mario Szpuszta, Pro ASP.NET 3.5 in C# 2008, New York, America: 
 Katie Stence, 2007.
90 Khoa học & Công nghệ - Số 9/Tháng 3 - 2016 Journal of Science and Technology
 ISSN 2354-0575
 [9]. Microsoft, (2014, May), Microsoft MSDN, [Online]. 
 ms142571.aspx
 [10]. Ban biên tập, (2014, May), Đại Học Quốc Gia Hà Nội, [Online]. 
 omy/term/28/2766.
 UTEHY RESEARCH: INFORMATION SHARING SYSTEM FOR SCIENCE RESEARCHES
Abstract:
 In recent years, the movement of scientific research in Hung Yen University of Technology and
Education increasingly promoted. Hundreds of research papers a year were published in the workshops, 
conferences, journals. These are important resources in scientific research. However, these materials are 
only stored on personal computers, so it is difficult forinformation exploiting. In this paper, we propose 
UTEHY Research System: (1) management of scientific articles; (2) sharing and exploitingdocument for 
research; (3) statistics ofthe data based on information of the papers; (4) providing news and events related 
to scientific researchboth within and outside school. The experimental results in the address 
utehy.edu.vn demonstrate that our system can efficiently support for scientific research.
Keywords: Publications software management, Articles software management.
Khoa học & Công nghệ - Số 9/Tháng 3 - 2016 Journal of Science and Technology 91

File đính kèm:

  • pdfutehy_research_he_thong_chia_se_thong_tin_phuc_vu_nghien_cuu.pdf