Trong bất kì nền kinh tế nào, đấu thầu luôn là phương thức hữu hiệu nhất để chủ đầu tư có thể chọn được những nhà thầu có khả năng tốt nhất và đưa ra mức giá hợp lý nhất. Ứng dụng các tiến bộ của công nghệ thông tin vào hoạt động đấu thầu mua sắm công trên cơ sở đảm bảo quản trị tốt, góp phần phát triển kinh tế xã hội, cải cách thủ tục hành chính, tăng cường tính công khai, minh bạch, cạnh tranh và hiệu quả kinh tế, ngăn ngừa tham nhũng và nâng cao niềm tin của người dân vào hoạt động đấu thầu mua sắm công.
1. Những vấn đề lý luận chung về đấu thầu và Hệ thống đấu thầu quốc gia
Theo Luật Đấu thầu, đấu thầu là quá trình lựa chọn nhà thầu để ký kết và thực hiện hợp đồng cung cấp dịch vụ tư vấn, dịch vụ phi tư vấn, mua sắm hàng hóa, xây lắp; lựa chọn nhà đầu tư để ký kết và thực hiện hợp đồng dự án đầu tư theo hình thức đối tác công tư, dự án đầu tư có sử dụng đất trên cơ sở bảo đảm cạnh tranh, công bằng, minh bạch và hiệu quả kinh tế.
Mục tiêu chính của đấu thầu là đảm bảo sự hiệu quả về chi phí, đảm bảo chọn lựa nhà thầu có khả năng thực hiện với giá hợp lý nhất. Đấu thầu tạo ra một môi trường cạnh tranh, khuyến khích sự cạnh tranh giữa các nhà thầu để cung cấp giải pháp hay sản phẩm tốt nhất. Quá trình đấu thầu cần đảm bảo tính minh bạch và công bằng trong quá trình chọn lựa nhà thầu, tạo niềm tin từ các bên liên quan.
Nguyên tắc cơ bản của đấu thầu:
■ Nguyên tắc cạnh tranh: Cung cấp cơ hội cho nhiều nhà thầu cạnh tranh, tạo điều kiện cho sự sáng tạo và cải thiện liên tục.
■ Nguyên tắc công bằng: Đảm bảo mỗi nhà thầu có cơ hội bình đẳng để tham gia và được đánh giá dựa trên năng lực thực sự.
■ Nguyên tắc minh bạch: Cung cấp thông tin đầy đủ và minh bạch về quá trình đấu thầu, từ quy trình chào giá đến lựa chọn nhà thầu.
■ Nguyên tắc hiệu quả chi phí: Chọn lựa nhà thầu dựa trên khả năng thực hiện hiệu quả và chi phí hợp lý.
Theo quy định tại Luật Đấu thầu, thì Hệ thống đấu thầu quốc gia là hệ thống công nghệ thông tin do cơ quan quản lý nhà nước về hoạt động đấu thầu xây dựng và quản lý nhằm mục đích thống nhất quản lý thông tin về đấu thầu và thực hiện đấu thầu qua mạng. Năm 2009, Bộ Kế hoạch và Đầu tư, với sự trợ giúp của Chính phủ Hàn Quốc mà đại diện là Cơ quan hợp tác quốc tế Hàn Quốc (KOICA), đã tiến hành xây dựng Hệ thống đấu thầu điện tử thử nghiệm tại địa chỉ http://muasamcong.mpi.gov.vn dựa trên Hệ thống mua sắm chính phủ điện tử của Hàn Quốc (KONEPS) và được tối ưu hóa phù hợp với điều kiện thực tiễn của Việt Nam. Trong giai đoạn thí điểm, Hệ thống do Bộ Kế hoạch và Đầu tư quản lý và vận hành cung cấp cho người sử dụng đầy đủ các chức năng từ đăng tải kế hoạch đấu thầu, sơ tuyển, thông báo mời thầu, nộp hồ sơ dự thầu, lập biên bản mở thầu cho đến đăng tải kết quả đấu thầu, kiến nghị trong đấu thầu…
Hệ thống đấu thầu quốc gia (hệ thống e-GP) mới được xây dựng trong khuôn khổ dự án "Ứng dụng thương mại điện tử trong mua sắm chính phủ" theo hình thức đối tác công tư (PPP) do Bộ Kế hoạch và Đầu tư là cơ quan quản lý nhà nước có thẩm quyền chỉ đạo. Theo đó, hệ thống e-GP chạy được trên đa trình duyệt và đáp ứng mục tiêu quản lý thống nhất thông tin về đấu thầu cũng như thực hiện đấu thầu qua mạng. Hệ thống mới được chạy trên địa chỉ: https://muasamcong.mpi.gov.vn thay vì địa chỉ cũ: http://muasamcong.mpi.gov.vn (khác nhau chữ "s" ở http).
Được đưa vào vận hành chính thức từ giữa tháng 9/2022, hệ thống e-GP được thiết kế với 11 phân hệ thành phần gồm cổng thông tin; quản lý người dùng; hỗ trợ người dùng; đấu thầu điện tử; mua sắm điện tử; quản lý hợp đồng điện tử; thanh toán điện tử; danh mục sản phẩm; văn bản điện tử; quản lý năng lực nhà cung cấp và bảo lãnh điện tử.
2. Thực trạng công tác thu thập, phân loại các thông tin về đấu thầu được đăng tải trên Hệ thống đấu thầu quốc gia tại Kiểm toán nhà nước
2.1. Nhu cầu về thu thập, phân loại thông tin về đấu thầu của Kiểm toán nhà nước
Trong quá trình kiểm toán, đối với việc kiểm toán công tác lựa chọn nhà thầu cho thấy các sai sót thường gặp như: Hồ sơ mời thầu không đầy đủ, rõ ràng, chi tiết; phê duyệt hồ sơ và kế hoạch lựa chọn thầu không đúng thẩm quyền, không đủ số lượng nhà thầu tham dự tối thiểu (đối với đấu thầu hạn chế) hoặc không có nhà thầu tham dự do lập giá gói thầu quá thấp, không chấp hành quy định về thời gian; mở thầu không đủ thành phần; xét thầu không công bằng, thiếu cơ sở; không tổ chức đấu thầu rộng rãi mà chỉ đấu thầu hạn chế hoặc chỉ định thầu; hồ sơ mời thầu lập có sai sót dẫn tới việc lựa chọn nhà thầu không đảm bảo yêu cầu dự án làm ảnh hưởng đến tiến độ và chất lượng công trình; mô tả gói thầu không đầy đủ, rõ ràng dẫn đến cách hiểu không như nhau dễ dẫn đến xảy ra tranh chấp khi thực hiện hợp đồng; tiêu chí đánh giá hồ sơ dự thầu không hợp lý, qua đó tạo điều kiện cho các nhà thầu có ít năng lực, kinh nghiệm vẫn có thể tham gia đấu thầu và trúng thầu hoặc có thể đưa ra những tiêu chí đánh giá bất lợi cho các nhà thầu có năng lực…
Qua đó cho thấy, nhu cầu về phần mềm thu thập, phân loại thông tin đấu thầu với mục tiêu: Xây dựng Hệ thống thông tin đấu thầu phục vụ hoạt động kiểm toán giúp nâng cao hiệu quả ứng dụng công nghệ thông tin trong hoạt động kiểm toán; hỗ trợ tổng hợp, thu thập được đầy đủ các thông tin về đấu thầu đáp ứng được nhu cầu của các kiểm toán viên, thành viên đoàn kiểm toán, tổ kiểm toán trong quá trình thực hiện kiểm tra tại các đơn vị và hoạt động kiểm toán nói chung cũng như khi có nhu cầu.
Kiểm toán nhà nước cần xác định rõ mục tiêu sử dụng thông tin đấu thầu để có cái nhìn chi tiết và tổng quan về các hoạt động đấu thầu mua sắm công. Việc này đặt ra câu hỏi về mục đích cụ thể như kiểm toán những gói thầu lớn, theo dõi chiến lược của nhà thầu hay đánh giá hiệu suất toàn bộ quá trình.
Về việc xác định độ chi tiết cần thiết: Nhu cầu về chi tiết thông tin cần phản ánh sự đa dạng và chiều sâu của các hoạt động đấu thầu. Kiểm toán nhà nước cần xác định mức độ chi tiết cần thiết để đảm bảo rằng thông tin thu được không chỉ đáp ứng các yêu cầu cụ thể của nhiệm vụ kiểm toán mà còn cung cấp cái nhìn tổng thể.
Quá trình thu thập và phân loại thông tin cần được thống nhất với các tiêu chuẩn và quy trình của Kiểm toán nhà nước. Điều này đảm bảo rằng dữ liệu thu được có tính nhất quán và có thể được so sánh và phân tích một cách hiệu quả. Ngoài việc xác định mục tiêu, Kiểm toán nhà nước cũng cần xác định đối tượng cụ thể cần theo dõi. Có thể đó là các gói thầu cụ thể, nhà thầu chiến lược, hoặc các dự án mua sắm công đặc biệt.
* Về phân loại nhu cầu, bao gồm: Thu thập thông tin và chuẩn hóa về đối tượng nghiệp vụ; Phân loại đối tượng; tìm mối liên kết giữa các đối tượng; hệ thống báo cáo về các đối tượng; nhu cầu phân tích chuyên sâu về các rủi ro trong hoạt động đấu thầu.
* Về nội dung, nhu cầu chủ yếu:
- Xây dựng Hệ thống thông tin đấu thầu phục vụ hoạt động kiểm toán cung cấp các thông tin về nhà thầu, nhà đầu tư, thông tin các gói thầu, kế hoạch lựa chọn nhà thầu.
- Thu thập thông tin đấu thầu phục vụ hoạt động kiểm toán là công cụ tác nghiệp của cán bộ có nhu cầu khai thác thông tin về đấu thầu trong quá trình thu thập thông tin kiểm toán.
- Hình thành cơ sở dữ liệu điện tử của cơ quan về thông tin đấu thầu, sẵn sàng phục vụ khai thác, phân tích thông tin khi cần thiết.
- Hệ thống thông tin đấu thầu phục vụ hoạt động kiểm toán cung cấp các thông tin về đấu thầu, được cài đặt trên hệ thống hạ tầng hiện có của Kiểm toán nhà nước. Kết nối và cung cấp dữ liệu cho các hệ thống phần mềm khác của Kiểm toán nhà nước nhằm tận dụng cơ sở hạ tầng công nghệ thông tin hiện có.
2.2 Thực trạng thu thập, phân loại thông tin về đấu thầu trên Hệ thống đấu thầu quốc gia
Hiện nay, cán bộ có nhu cầu tìm hiểu về thông tin đấu thầu gắn với các đối tượng được kiểm toán là hoàn toàn thụ động, phải thông qua sự chắt lọc từ những thông tin rời rạc thu thập được từ trên mạng qua các nguồn khác nhau, do đó thông tin không đảm bảo đầy đủ, chính xác như mong muốn.
Trong quá trình thu thập dữ liệu cho thấy dữ liệu lấy từ Hệ thống đấu thầu quốc gia vẫn là dữ liệu thô, nhiều trường dữ liệu chưa được chuẩn hóa, chưa được tổ chức thành danh mục (ví dụ như đối với dự án và chủ đầu tư), thiếu thông tin định danh.

Vì vậy, để khai thác được dữ liệu theo đơn vị, chủ đầu tư hoặc bên mời thầu, liên kết thông tin dự án, gói thầu và quá trình tổ chức đấu thầu, cần phải tổ chức chuẩn hóa dữ liệu để liên kết được dữ liệu, từ đó phục vụ việc tìm kiếm, khai thác thông tin bằng phần mềm theo các tiêu chí khác nhau.
Hiện tại, các kiểm toán viên nói riêng và Kiểm toán nhà nước hiện chưa có một công cụ hữu hiệu nào có thể tổng hợp, thu thập được đầy đủ các thông tin về đấu thầu đáp ứng được nhu cầu của cán bộ kiểm toán khi có nhu cầu. Trong khi đó, xu thế chung hiện nay, lựa chọn nhà thầu qua mạng đã dần trở nên phổ biến.
2.3 Hạn chế, tồn tại trong thu thập, phân loại thông tin về đấu thầu trên Hệ thống đấu thầu quốc gia
- Công tác thống kê số liệu: Các dự án được đăng tải trên Hệ thống đấu thầu quốc gia độc lập với nhau, không có thông tin để phân cấp dự án và các dự án thành phần (dự án cha và các dự án thành phần hoặc tiểu dự án).
- Một dự án nhưng được đăng nhiều lần theo tiến độ triển khai gói thầu thực tế có thể dẫn đến số thống kê dự án sẽ tăng nhiều so với thực tế, đồng thời ảnh hưởng đến việc liên kết thông tin dự án và các gói thầu trong dự án.
- Thông tin dự án khai thác theo nhóm dự án được đăng tải còn chưa theo tiêu chí phân loại dự án được quy định tại Luật Đầu tư công.
- Quá tải thông tin: Lượng thông tin đấu thầu khổng lồ có sẵn trên Hệ thống đấu thầu quốc gia đôi khi có thể quá tải, khiến kiểm toán viên gặp khó khăn trong việc xác định các thông tin phù hợp nhất
- Xác định hiệu quả (tỷ lệ tiết kiệm) công tác đấu thầu, lựa chọn nhà thầu các dự án sử dụng vốn đầu tư công.
- Hạn chế trong xác minh thông tin: Việc phân loại thông tin đấu thầu có sẵn trên Hệ thống đấu thầu quốc gia để tránh lãng phí thời gian và nguồn lực khi truy cập, khai thác. Như: Xác định số lượng nhà thầu tham dự; Xác định đảm bảo dự thầu; Xác định việc điều chỉnh, bổ sung sau khi nộp hồ sơ dự thầu; Xác định việc liên danh giữa các nhà thầu; Xác định ý kiến phản hồi về sai sót của hồ sơ mời thầu…
3. Giải pháp ứng dụng công nghệ thông tin trong thu thập, phân loại các thông tin về đấu thầu từ Hệ thống đấu thầu quốc gia
3.1. Tổng quan về các giải pháp ứng dụng công nghệ thông tin trong thu thập, phân tích, xử lý dữ liệu
Thu thập dữ liệu là quá trình tổng hợp và đánh giá thông tin hoặc dữ liệu từ nhiều nguồn khác nhau để tìm kiếm câu trả lời cho vấn đề nghiên cứu, giải đáp câu hỏi, đánh giá kết quả và dự báo xu hướng và xác suất. Đây là một giai đoạn quan trọng trong mọi nghiên cứu, phân tích và quyết định, bao gồm cả những công việc trong lĩnh vực khoa học xã hội, kinh doanh và chăm sóc sức khỏe. Các phương pháp thu thập dữ liệu thay đổi tùy thuộc vào loại ứng dụng cụ thể. Một số phương pháp liên quan đến việc sử dụng công nghệ, trong khi những phương pháp khác lại là quy trình thủ công.
Trong quá trình thu thập dữ liệu, có 5 bước chính cần được thực hiện. Dưới đây là giải thích ngắn gọn về mỗi bước: Quyết định dữ liệu muốn thu thập; Thiết lập thời hạn thu thập dữ liệu; Chọn phương pháp thu thập dữ liệu; Thu thập thông tin; Kiểm tra thông tin và áp dụng kết quả.
Dữ liệu ở dạng thô thường không có nhiều giá trị hữu ích, vì vậy để khai thác triệt để các thông tin và giá trị từ dữ liệu thì quá trình xử lý dữ liệu là rất cần thiết. Xử lý dữ liệu là phương pháp thu thập dữ liệu thô và chuyển nó thành thông tin có thể sử dụng được. Dữ liệu sau khi thu thập sẽ lần lượt trải qua các quá trình như lọc, sắp xếp, xử lý, phân tích, lưu trữ… Quy trình này thường được thực hiện bởi các nhà khoa học và kỹ sư dữ liệu.
Về cơ bản, chu trình xử lý dữ liệu thường có 6 giai đoạn được thể hiện như Hình dưới đây:

Chu trình xử lý dữ liệu
3.2 Mô hình giải pháp tổng thể
Để tối ưu hóa quá trình thu thập và phân loại thông tin đấu thầu trên Hệ thống đấu thầu quốc gia, nghiên cứu đề xuất xây dựng một mô hình tích hợp chứa đựng các thành phần chính: (1) Web Crawling (WS), (2) Mô hình AI, (3) Kho dữ liệu (Data warehouse - DWH) và (4) Business Intelligence (BI). Mô hình này không chỉ giúp thu thập dữ liệu một cách hiệu quả mà còn tự động hóa quá trình phân loại thông tin. Các thành phần của mô hình được miêu tả như Hình 2.1 dưới đây:

Mô hình tổng thể đề xuất Tổng quan chức năng của từng thành phần được miêu tả như sau:
1. Web Crawling và Thu thập thông tin: Sử dụng Scrapy để tự động hóa việc thu thập thông tin từ trang web đấu thầu quốc gia. Điều này giúp tiết kiệm thời gian và đảm bảo tính chính xác và linh hoạt trong quá trình thu thập dữ liệu động.
2. Mô hình AI - NLP: Sử dụng mô hình AI NLP như BERT để phân loại thông tin đấu thầu thành các đối tượng nghiệp vụ cụ thể. Mô hình này tự động cập nhật khi có dữ liệu mới. Cùng với đó các thư viện xử lý ngôn ngữ tự nhiên như NLTK hoặc spaCy để tiền xử lý văn bản. Đồng thời, chuẩn hóa dữ liệu về định dạng chuẩn để thuận tiện cho quá trình phân loại. Với mô hình này, chúng sẽ đạt được hiệu quả cao, giảm thiểu sự can thiệp của con người, và đảm bảo tính chính xác và linh hoạt trong quá trình quản lý thông tin đấu thầu quốc gia.
3. Kho dữ liệu (Data warehouse - DWH): Dữ liệu thu thập và xử lý được lưu trữ trong kho dữ liệu linh hoạt. Điều này giúp quản lý hiệu suất và tốc độ truy vấn, đồng thời đáp ứng nhanh chóng với sự gia tăng lượng dữ liệu.
4. Xây dựng Hệ thống Business Intelligence (BI): Các công cụ BI như Tableau hoặc Power BI được tích hợp để tạo ra các bảng điều khiển và báo cáo dữ liệu. Điều này giúp người dùng dễ dàng tạo các thống kê quan trọng và tương tác với thông tin. Dữ liệu sau khi phân loại cũng sẽ được tích hợp vào công cụ BI giúp người dùng nhanh chóng tìm hiểu thông tin và xu hướng.
3.3 Giải pháp ứng dụng công nghệ thông tin trong việc thu thập dữ liệu từ Hệ thống đấu thầu quốc gia
Giải pháp đề xuất Web crawling: Web crawling là một phương pháp tự động hóa để thu thập dữ liệu từ trang web một cách hiệu quả. Trong trường hợp này, Web crawling sẽ được áp dụng để trích xuất thông tin về đấu thầu từ Hệ thống đấu thầu quốc gia.

Minh họa về Web Crawling Các ưu điểm khi sử dụng phương pháp này có thể kể đến như:
• Tiết kiệm thời gian và năng lực: Web crawling giúp tự động hóa quá trình thu thập dữ liệu, giảm thiểu sự can thiệp thủ công và tiết kiệm thời gian cho Kiểm toán nhà nước.
• Độ chính xác và tính nhất quán: Phương pháp này cung cấp độ chính xác và tính nhất quán cao vì thông tin được lấy trực tiếp từ nguồn mà không phải thông qua bước trung gian.
• Theo dõi thời gian thực: Web crawling có thể được thiết lập để theo dõi thời gian thực, đảm bảo rằng Kiểm toán nhà nước có được thông tin mới nhất và cập nhật.
Về các bước thực hiện giải pháp Web Crawling có thể bao gồm các công việc như:
1. Lập kế hoạch và thiết kế cấu trúc Web Crawling: Xác định các trang web cần thu thập dữ liệu, và thiết kế cấu trúc web crawling để đảm bảo phủ hết thông tin quan trọng từ các trang đó.
2. Xác định dữ liệu cần thu thập: Đặt ra các tiêu chí cụ thể và quyết định loại thông tin cần thu thập từ Hệ thống đấu thầu quốc gia. Điều này bao gồm thông tin về gói thầu, chủ thầu, lịch sử đấu thầu, v.v.
3. Phát triển và tối ưu hóa robot web crawling: Xây dựng robot web crawling hoặc sử dụng các công cụ có sẵn, điều chỉnh và tối ưu hóa chúng để đảm bảo hiệu suất và tính ổn định trong quá trình thu thập dữ liệu.
4. Xử lý dữ liệu thu thập: Sau khi thu thập được dữ liệu, tiến hành xử lý để đảm bảo độ chính xác và phù hợp với định dạng mà Kiểm toán nhà nước yêu cầu.
5. Đảm bảo tuân thủ pháp luật và chính sách: Kiểm tra và đảm bảo rằng quá trình web crawling tuân thủ tất cả các quy định pháp luật và chính sách về quyền riêng tư và bảo mật thông tin.
Nghiên cứu đề xuất giải pháp thu thập dữ liệu từ Hệ thống đấu thầu quốc gia bằng kỹ thuật Web crawling được mô tả như Hình 2.11 dưới đây:

Giải pháp thu thập dữ liệu từ bằng kỹ thuật Web Crawling Phương pháp Web Crawling được thực hiện thông qua việc bóc tách và phân tích trên hệ thống website e-GP. Quá trình thu thập dữ liệu được tổ chức thông qua các luồng xử lý và tiến trình dựa trên các thuật toán tiên tiến. Điều này không chỉ giới hạn việc quét qua các trang, thu thập và lập chỉ mục thông tin mà còn mở rộng tìm kiếm đến các liên kết có liên quan, tăng cường phạm vi thu thập.
Các tiến trình được đặt lịch trình chạy theo các khoảng thời gian cụ thể, giúp đảm bảo sự đều đặn và hiệu quả trong việc cập nhật dữ liệu. Quá trình này không chỉ giúp tự động hóa thu thập mà còn đảm bảo rằng thông tin mới nhất và quan trọng nhất được cập nhật đúng, kịp thời.
Dữ liệu sau khi thu thập được không chỉ được lưu trữ trong cơ sở dữ liệu mà còn kèm theo Meta-data của chúng, giúp theo dõi nguồn gốc, thời gian thu thập và các thông tin liên quan khác. Quá trình này giúp tạo ra một nguồn dữ liệu có cấu trúc, dễ quản lý và có thể được sử dụng một cách hiệu quả cho quá trình kiểm toán và phân tích.
3.4. Giải pháp ứng dụng công nghệ thông tin trong việc xử lý và phân loại các thông tin về đấu thầu sau khi thu thập từ Hệ thống đấu thầu quốc gia
Việc phân loại và xử lý lượng lớn thông tin từ Hệ thống đấu thầu quốc gia đòi hỏi giải pháp hiệu quả và tự động để tối ưu hóa công việc kiểm toán. Một trong những phương pháp tiên tiến là sử dụng Trí tuệ nhân tạo và cụ thể là các mô hình xử lý ngôn ngữ tự nhiên (NLP). Mô hình xử lý được đề xuất như sau:

Mô hình xử lý, phân loại dữ liệu đề xuất Tiền xử lý dữ liệu:
■ Dữ liệu đấu thầu thu thập từ Hệ thống đấu thầu quốc gia được tiền xử lý để loại bỏ nhiễu và chuẩn hóa văn bản.
■ Các thông tin cần phân loại như loại hình đấu thầu, ngành nghề, quy mô dự án được trích xuất và gán nhãn.
Lựa chọn mô hình NLP:
■ Chọn một mô hình NLP phù hợp với yêu cầu, có khả năng hiểu và phân tích các thuộc tính đặc trưng của dữ liệu đấu thầu. Các mô hình học máy hiện đại như BERT, GPT, hoặc các mô hình phân loại văn bản như Naive Bayes có thể được sử dụng.
Huấn luyện mô hình:
■ Mô hình NLP được huấn luyện trên dữ liệu được gán nhãn để học cách phân loại thông tin vào các danh mục tương ứng. Cùng với đó là tối ưu hóa mô hình để đạt được độ chính xác cao và khả năng tự động hóa tốt.
Phân loại tự động:
■ Mô hình được triển khai để tự động phân loại thông tin mới từ Hệ thống đấu thầu quốc gia vào các danh mục đã xác định trước.
■ Quá trình này diễn ra liên tục và tự động, giúp cập nhật thông tin mới một cách nhanh chóng.
Điều chỉnh và giám sát:
■ Liên tục giám sát hoạt động của mô hình để đảm bảo độ chính xác và đồng nhất trong việc phân loại.
■ Nếu có thay đổi trong cấu trúc dữ liệu đấu thầu hoặc xuất hiện các trường hợp đặc biệt, mô hình được điều chỉnh để phản ánh những thay đổi này.
Tính tự động và linh hoạt của các mô hình NLP trong việc phân loại dữ liệu đấu thầu giúp tối ưu hóa quá trình kiểm toán, giảm công sức và thời gian, đồng thời đảm bảo rằng thông tin được sắp xếp và quản lý một cách chính xác và hiệu quả.
Mô hình tra cứu thông tin
Về việc sử dụng mô hình tra cứu thông tin, Elasticsearch là một công nghệ mạnh mẽ được sử dụng chủ yếu cho việc tra cứu và lưu trữ dữ liệu trong các ứng dụng và hệ thống phức tạp. Được xây dựng dựa trên Apache Lucene, Elasticsearch cung cấp một cơ sở dữ liệu tìm kiếm phân tán, linh hoạt và hiệu suất cao.
Các ưu điểm chính của Elasticsearch:
■ Tra cứu hiệu quả: Elasticsearch sử dụng cơ sở dữ liệu ngược (inverted index) để tăng tốc quá trình tra cứu. Điều này giúp tìm kiếm thông tin một cách nhanh chóng và hiệu quả, đặc biệt khi đối mặt với lượng dữ liệu lớn.
■ Phân tán và mở rộng dễ dàng: Elasticsearch được thiết kế để hoạt động trên một mô hình phân tán, cho phép nó linh hoạt mở rộng để xử lý tăng trưởng dữ liệu và người dùng. Cụm máy chủ có thể được thêm vào hệ thống mà không làm giảm hiệu suất.
■ Lưu trữ dữ liệu đa dạng: Elasticsearch hỗ trợ lưu trữ và tra cứu nhiều loại dữ liệu khác nhau, bao gồm văn bản, số, địa lý, và nhiều loại dữ liệu khác. Điều này làm cho nó trở thành một giải pháp đa nhiệm cho nhiều loại ứng dụng.
■ Api đa dạng: Elasticsearch cung cấp nhiều api cho phép tương tác với hệ thống, bao gồm Restful API, Json API, và nhiều API khác, giúp dễ dàng tích hợp và tương tác với các ứng dụng khác.
■ Hỗ trợ tìm kiếm gần nhất (proximity search): Elasticsearch cho phép thực hiện các truy vấn tìm kiếm gần nhất, giúp người dùng tìm kiếm thông tin có liên quan dựa trên sự gần kề của từ khóa.
Mô hình tra cứu thông tin dựa trên Elasticsearch được đề xuất như sau:

Mô hình tra cứu thông tin Theo mô hình trên, kiểm toán viên sử dụng giao diện tra cứu thông tin để trực tiếp tương tác với Hệ thống Elasticsearch, nơi chứa dữ liệu đấu thầu. Dưới đây là mô tả chi tiết về cấu trúc của hệ thống:
■ Kiểm toán viên: là người sử dụng cuối cùng của hệ thống, kiểm toán viên sử dụng giao diện tra cứu thông tin để thực hiện các truy vấn và tìm kiếm thông tin liên quan đến đấu thầu. Giao diện này có thể cung cấp các tính năng tìm kiếm nâng cao, lọc dữ liệu và hiển thị kết quả một cách trực quan.
■ Giao diện tra cứu thông tin: giao diện này là điểm giao tiếp giữa kiểm toán viên và hệ thống. Nó có thể được thiết kế để đơn giản, dễ sử dụng và có khả năng tương tác linh hoạt.
■ Hệ thống Elasticsearch: là cốt lõi của hệ thống, Elasticsearch chứa và quản lý dữ liệu đấu thầu. Các chức năng chính bao gồm tra cứu, tìm kiếm, và lưu trữ dữ liệu một cách hiệu quả.
■ Dữ liệu đấu thầu: gồm ba phần chính: kế hoạch lựa chọn nhà thầu, thông báo mời thầu, và kết quả lựa chọn nhà thầu. Mỗi phần có thể được tổ chức và lưu trữ theo định dạng cấu trúc, giúp việc tra cứu và tìm kiếm trở nên thuận tiện.
Với mô hình này, kiểm toán viên có khả năng nhanh chóng và dễ dàng tìm kiếm thông tin cần thiết với giao diện tra cứu thông tin và sức mạnh của Elasticsearch. Dữ liệu đấu thầu được tổ chức và lưu trữ một cách linh hoạt, cho phép dễ dàng mở rộng và thêm mới thông tin khi cần thiết.
Kết luận
Bài viết đã tập trung phân tích và đề xuất giải pháp ứng dụng công nghệ thông tin để hỗ trợ hoạt động kiểm toán của Kiểm toán nhà nước trong việc thu thập và phân loại thông tin về đấu thầu từ Hệ thống đấu thầu quốc gia. Bài viết đã chỉ ra rằng việc ứng dụng công nghệ thông tin không chỉ giúp tăng hiệu quả công việc, giảm thiểu sai sót, mà còn mở ra cơ hội tích hợp thông tin từ nhiều nguồn khác nhau, tạo ra một cơ sở dữ liệu tổ chức và dễ quản lý. Bằng cách này, Kiểm toán nhà nước có thể nâng cao khả năng đáp ứng nhanh chóng và linh hoạt trước sự biến động của môi trường kinh tế. Sự ứng dụng công nghệ thông tin không chỉ đơn thuần là một tiến bộ trong công nghệ mà còn là một bước quan trọng hướng tới sự minh bạch, công khai và niềm tin từ phía cộng đồng và dư luận.
Tóm lại, việc ứng dụng công nghệ thông tin không chỉ là một nhu cầu cần thiết mà còn là một bước quan trọng để đưa Kiểm toán nhà nước vào một tương lai hiệu quả và tích cực hơn trong việc đảm bảo sự minh bạch và công khai trong quá trình kiểm toán.
Tài liệu tham khảo
1. Luật Đấu thầu số 43/2013/QH13 ngày 26/11/2013 và Luật Đấu thầu số 22/2023/QH15 ngày 23/06/2023 của Quốc hội; Nghị định số 63/2014/NĐ-CP ngày 26/6/2014 và Nghị định 24/2024/NĐ-CP ngày 27/02/2024 của Chính phủ quy định chi tiết thi hành một số điều của Luật Đấu thầu về lựa chọn nhà thầu;
2. Thông tư số 06/2017/TT-BKHĐT ngày 05/12/2017 của Bộ Kế hoạch và Đầu tư quy định chi tiết việc cung cấp thông tin về đấu thầu, báo cáo tình hình thực hiện hoạt động đấu thầu về lựa chọn nhà thầu;
3. Thông tư số 08/2022/TT-BKHĐT ngày 31/05/2022 quy định chi tiết việc cung cấp, đăng tải thông tin về đấu thầu và lựa chọn nhà thầu trên Hệ thống mạng đấu thầu quốc gia và Thông tư số 01/2024/TT-BKHĐT ngày 15/02/2024 của Bộ Kế hoạch và Đầu tư hướng dẫn việc cung cấp, đăng tải thông tin về lựa chọn nhà thầu và mẫu hồ sơ đấu thầu trên hệ thống mạng đấu thầu quốc gia;
4. Quyết định 47/2021/QĐ-KTNN ngày 14/01/2021 của Kiểm toán nhà nước ban hành hướng dẫn kiểm toán dự án đầu tư xây dựng công trình của Kiểm toán nhà nước.
Tác giả:
ThS. Đào Trọng Tường, ThS. Trần Việt - Kiểm toán nhà nước chuyên ngành VII
(Theo Tạp chí Nghiên cứu Khoa học kiểm toán - số tháng 9/2024)