Vào sáng thứ Ba theo giờ miền Đông Mỹ, nhà cung cấp dịch vụ cơ sở hạ tầng Internet Cloudflare cho biết mạng lưới toàn cầu của họ đang gặp sự cố bất thường, dẫn đến việc nhiều trang web, bao gồm cả nền tảng truyền thông xã hội X, xuất hiện lỗi “internal server error” và gặp khó khăn trong việc truy cập. Người dùng không thể truy cập nhiều trang web và dịch vụ, bao gồm bán lẻ, thương mại điện tử, mạng xã hội, dịch vụ tài chính và các nền tảng liên quan đến giao thông. Công ty sau đó tuyên bố rằng họ đã khắc phục sự cố trong chưa đầy bốn giờ.
Trong thời gian ngừng hoạt động, một số chức năng của X bị gián đoạn, nhiều trang web cũng gặp phải tình trạng truy cập bị cản trở. Theo dữ liệu từ nền tảng theo dõi sự cố Downdetector, ngoài X, cũng có nhiều trang web khác bị ảnh hưởng, số lượng báo cáo liên quan tiếp tục tăng lên. Người dùng khi truy cập vào các trang web như X, ChatGPT, DoorDash, IKEA, cũng như Cơ quan Vận tải Metropolitan của Thành phố New York (MTA), đều thấy thông báo lỗi liên quan đến Cloudflare.
Sau đó, một nữ phát ngôn viên của Cloudflare cho biết, vào khoảng 6 giờ 20 phút sáng theo giờ miền Đông Hoa Kỳ, một trong những dịch vụ của họ đã gặp phải sự gia tăng lưu lượng bất thường, dẫn đến lưu lượng qua mạng công ty xảy ra lỗi.
Một phát ngôn viên khác của Cloudflare, Jackie Dutton, đã nói trong thông báo rằng vấn đề này được gây ra bởi một hồ sơ cấu hình tự động được sử dụng để quản lý lưu lượng đe dọa, việc khắc phục mất chưa đến bốn giờ. Công ty cho biết đã triển khai các biện pháp sửa chữa cốt lõi, nhưng thận trọng chỉ ra rằng hệ thống “vẫn cần thời gian để hoàn toàn ổn định.”
Dutton cho biết:
“Số lượng mục trong tài liệu này vượt quá kích thước dự kiến, đã kích hoạt sự cố hệ thống phần mềm xử lý lưu lượng dịch vụ Cloudflare.”
Tuyên bố cho biết không có bằng chứng nào cho thấy sự kiện này liên quan đến tấn công mạng hoặc hoạt động độc hại.
Tầm ảnh hưởng của sự cố là rất rộng lớn. Downdetector trên nền tảng cho biết, trong thời gian Cloudflare sập, “số lượng báo cáo về các dịch vụ bị ảnh hưởng đã vượt quá 2,1 triệu”, cho thấy sự kiện này đã trở thành một trong những sự gián đoạn hạ tầng nghiêm trọng nhất trong những năm gần đây.
Sau khi xảy ra sự cố, giá cổ phiếu của Cloudflare đã giảm mạnh 7% trong phiên giao dịch mở cửa vào thứ Ba, sau đó mức giảm đã thu hẹp lại.
Ngành tài sản số cũng đã có phản ứng. Đồng sáng lập và cựu CEO của Binance, Zhao Changpeng đã đăng bài trên X nói rằng: “Blockchain vẫn hoạt động bình thường (Blockchain kept working)”, ngụ ý rằng hệ thống phi tập trung không bị ảnh hưởng bởi sự kiện lần này.
Đến 12:15 giờ miền Đông nước Mỹ, Cloudflare cho biết hệ thống đang dần được phục hồi, nhưng một số khu vực trên toàn cầu vẫn có thể gặp lỗi truy cập, giảm hiệu suất hoặc vấn đề đăng nhập. Công ty sẽ liên tục cập nhật tiến độ sửa chữa trên trang trạng thái.
Phụ thuộc quá nhiều vào một số công ty
Trong những năm gần đây, đã xảy ra nhiều vấn đề với các nhà cung cấp hạ tầng số, dẫn đến việc sử dụng internet toàn cầu bị tê liệt. Dịch vụ điện toán đám mây Amazon (AWS), CrowdStrike Holdings Inc. và Microsoft đã gặp phải các sự cố tương tự, cũng làm nổi bật sự phụ thuộc lớn của internet toàn cầu vào một số ít công ty cung cấp dịch vụ.
Dịch vụ của Cloudflare và AWS gần như “vô hình” đối với người dùng thông thường, nhưng các công cụ của họ hỗ trợ rất nhiều trang web và dịch vụ mà người tiêu dùng sử dụng mỗi ngày.
Tháng trước, sự cố ngừng hoạt động của AWS đã khiến một số khu vực của Internet rơi vào tình trạng tê liệt, khiến hàng triệu người dùng không thể truy cập vào các trang web và ứng dụng, cản trở doanh số bán lẻ, gián đoạn dịch vụ truyền thông xã hội và tài chính, và nhiều doanh nghiệp cũng bị ảnh hưởng. Năm ngoái, một lỗ hổng trong một công cụ mà công ty an ninh mạng CrowdStrike sử dụng đã khiến hệ thống máy tính toàn cầu sụp đổ hàng loạt, dẫn đến hàng nghìn chuyến bay bị hoãn và hủy, đồng thời làm cho hoạt động của các cơ quan chính phủ và doanh nghiệp lớn rơi vào hỗn loạn.
Chuyên gia Graeme Stewart của công ty an ninh mạng Check Point Software ở California cho biết, các sự cố như vậy làm nổi bật sự phụ thuộc quá mức của Internet vào một vài nhà cung cấp cơ sở hạ tầng.
Ông ấy nói:
“Nhiều tổ chức vẫn để tất cả các dịch vụ quan trọng phụ thuộc vào cùng một đường dẫn, và không có một bản sao lưu thực sự hiệu quả nào. Một khi đường dẫn này gặp vấn đề, sẽ không có bất kỳ kế hoạch dự phòng nào. Đây chính là vấn đề mà chúng ta đã thấy từ trước đến nay.”
Giáo sư an ninh mạng Alan Woodward từ Đại học Surrey cho biết, sự cố vào thứ Ba lại một lần nữa cho thấy internet phụ thuộc rất nhiều vào “một số ít người chơi”. Ông mô tả Cloudflare là “công ty lớn nhất mà bạn chưa bao giờ nghe thấy”.
“Con người không còn lựa chọn nào khác ngoài việc phụ thuộc vào những công ty lớn này.”
Giám đốc công nghệ xin lỗi
Giám đốc công nghệ của Cloudflare, Dane Knecht, đã xin lỗi về sự cố này. Ông đã viết trên X:
“Khi mạng lưới Cloudflare gặp sự cố, ảnh hưởng đến lượng truy cập khổng lồ dựa vào chúng tôi, chúng tôi đã làm mất lòng khách hàng và cả toàn bộ Internet. Vấn đề này, tác động của nó và thời gian để giải quyết là không thể chấp nhận được. Chúng tôi đã bắt đầu thực hiện các biện pháp để đảm bảo rằng tình huống tương tự sẽ không xảy ra lần nữa, nhưng tôi biết rằng hôm nay thực sự đã gây rắc rối cho mọi người. Niềm tin của khách hàng là điều quan trọng nhất đối với chúng tôi, và chúng tôi sẽ nỗ lực hết sức để lấy lại niềm tin này.”
Cloudflare đã trải qua nhiều lần ngừng hoạt động tương tự trong vài năm qua.
Vào tháng 7 năm 2019, một lỗ hổng trong phần mềm Cloudflare đã dẫn đến việc một số mô-đun mạng sử dụng quá nhiều tài nguyên tính toán, khiến hàng nghìn trang web trên toàn cầu phụ thuộc vào Cloudflare (bao gồm Discord, Shopify, SoundCloud và Coinbase) ngoại tuyến trong khoảng 30 phút. Vào tháng 6 năm 2022, Cloudflare đã gặp sự cố, ảnh hưởng đến lưu lượng của 19 trung tâm dữ liệu của mình, dẫn đến việc nhiều trang web và dịch vụ lớn bị tê liệt, kéo dài khoảng một tiếng rưỡi.
Phần mềm của Cloudflare được hàng trăm ngàn công ty trên toàn cầu sử dụng, như một lớp đệm giữa trang web doanh nghiệp và người dùng cuối, nhằm bảo vệ trang web khỏi các cuộc tấn công lưu lượng hoặc sự cố do lưu lượng đột biến gây ra.
Năm ngoái, một bản cập nhật phần mềm lỗi do công ty an ninh mạng CrowdStrike phát hành đã khiến hàng triệu thiết bị chạy hệ điều hành Microsoft Windows gặp sự cố, gây ra sự hỗn loạn lớn trong nhiều ngành như hàng không, ngân hàng, y tế.
Sự cố ngừng hoạt động của CrowdStrike xuất phát từ một lỗi trong sản phẩm của họ chạy ở mức độ thấp nhất trên máy tính của khách hàng. Còn Cloudflare có vai trò bảo vệ hạ tầng Internet, như các trang web và nền tảng, vì vậy khi Cloudflare gặp sự cố, nhiều trang web phổ biến sẽ không thể truy cập hoặc gặp sự cố. Cloudflare chủ yếu chịu trách nhiệm “giữ cho các trang web luôn trực tuyến và có tốc độ đủ nhanh”, trong khi CrowdStrike tập trung vào việc bảo vệ máy tính và máy chủ khỏi các cuộc tấn công.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
「Tôi hoảng sợ, chuyện gì đã xảy ra?」,Sự cố của Cloudflare gây ra hỗn loạn trên toàn cầu Internet
Tác giả: Triệu Vũ Hà
Nguồn: Wall Street Journal
Vào sáng thứ Ba theo giờ miền Đông Mỹ, nhà cung cấp dịch vụ cơ sở hạ tầng Internet Cloudflare cho biết mạng lưới toàn cầu của họ đang gặp sự cố bất thường, dẫn đến việc nhiều trang web, bao gồm cả nền tảng truyền thông xã hội X, xuất hiện lỗi “internal server error” và gặp khó khăn trong việc truy cập. Người dùng không thể truy cập nhiều trang web và dịch vụ, bao gồm bán lẻ, thương mại điện tử, mạng xã hội, dịch vụ tài chính và các nền tảng liên quan đến giao thông. Công ty sau đó tuyên bố rằng họ đã khắc phục sự cố trong chưa đầy bốn giờ.
Trong thời gian ngừng hoạt động, một số chức năng của X bị gián đoạn, nhiều trang web cũng gặp phải tình trạng truy cập bị cản trở. Theo dữ liệu từ nền tảng theo dõi sự cố Downdetector, ngoài X, cũng có nhiều trang web khác bị ảnh hưởng, số lượng báo cáo liên quan tiếp tục tăng lên. Người dùng khi truy cập vào các trang web như X, ChatGPT, DoorDash, IKEA, cũng như Cơ quan Vận tải Metropolitan của Thành phố New York (MTA), đều thấy thông báo lỗi liên quan đến Cloudflare.
Sau đó, một nữ phát ngôn viên của Cloudflare cho biết, vào khoảng 6 giờ 20 phút sáng theo giờ miền Đông Hoa Kỳ, một trong những dịch vụ của họ đã gặp phải sự gia tăng lưu lượng bất thường, dẫn đến lưu lượng qua mạng công ty xảy ra lỗi.
Một phát ngôn viên khác của Cloudflare, Jackie Dutton, đã nói trong thông báo rằng vấn đề này được gây ra bởi một hồ sơ cấu hình tự động được sử dụng để quản lý lưu lượng đe dọa, việc khắc phục mất chưa đến bốn giờ. Công ty cho biết đã triển khai các biện pháp sửa chữa cốt lõi, nhưng thận trọng chỉ ra rằng hệ thống “vẫn cần thời gian để hoàn toàn ổn định.”
Dutton cho biết:
“Số lượng mục trong tài liệu này vượt quá kích thước dự kiến, đã kích hoạt sự cố hệ thống phần mềm xử lý lưu lượng dịch vụ Cloudflare.”
Tuyên bố cho biết không có bằng chứng nào cho thấy sự kiện này liên quan đến tấn công mạng hoặc hoạt động độc hại.
Tầm ảnh hưởng của sự cố là rất rộng lớn. Downdetector trên nền tảng cho biết, trong thời gian Cloudflare sập, “số lượng báo cáo về các dịch vụ bị ảnh hưởng đã vượt quá 2,1 triệu”, cho thấy sự kiện này đã trở thành một trong những sự gián đoạn hạ tầng nghiêm trọng nhất trong những năm gần đây.
Sau khi xảy ra sự cố, giá cổ phiếu của Cloudflare đã giảm mạnh 7% trong phiên giao dịch mở cửa vào thứ Ba, sau đó mức giảm đã thu hẹp lại.
Ngành tài sản số cũng đã có phản ứng. Đồng sáng lập và cựu CEO của Binance, Zhao Changpeng đã đăng bài trên X nói rằng: “Blockchain vẫn hoạt động bình thường (Blockchain kept working)”, ngụ ý rằng hệ thống phi tập trung không bị ảnh hưởng bởi sự kiện lần này.
Đến 12:15 giờ miền Đông nước Mỹ, Cloudflare cho biết hệ thống đang dần được phục hồi, nhưng một số khu vực trên toàn cầu vẫn có thể gặp lỗi truy cập, giảm hiệu suất hoặc vấn đề đăng nhập. Công ty sẽ liên tục cập nhật tiến độ sửa chữa trên trang trạng thái.
Phụ thuộc quá nhiều vào một số công ty
Trong những năm gần đây, đã xảy ra nhiều vấn đề với các nhà cung cấp hạ tầng số, dẫn đến việc sử dụng internet toàn cầu bị tê liệt. Dịch vụ điện toán đám mây Amazon (AWS), CrowdStrike Holdings Inc. và Microsoft đã gặp phải các sự cố tương tự, cũng làm nổi bật sự phụ thuộc lớn của internet toàn cầu vào một số ít công ty cung cấp dịch vụ.
Dịch vụ của Cloudflare và AWS gần như “vô hình” đối với người dùng thông thường, nhưng các công cụ của họ hỗ trợ rất nhiều trang web và dịch vụ mà người tiêu dùng sử dụng mỗi ngày.
Tháng trước, sự cố ngừng hoạt động của AWS đã khiến một số khu vực của Internet rơi vào tình trạng tê liệt, khiến hàng triệu người dùng không thể truy cập vào các trang web và ứng dụng, cản trở doanh số bán lẻ, gián đoạn dịch vụ truyền thông xã hội và tài chính, và nhiều doanh nghiệp cũng bị ảnh hưởng. Năm ngoái, một lỗ hổng trong một công cụ mà công ty an ninh mạng CrowdStrike sử dụng đã khiến hệ thống máy tính toàn cầu sụp đổ hàng loạt, dẫn đến hàng nghìn chuyến bay bị hoãn và hủy, đồng thời làm cho hoạt động của các cơ quan chính phủ và doanh nghiệp lớn rơi vào hỗn loạn.
Chuyên gia Graeme Stewart của công ty an ninh mạng Check Point Software ở California cho biết, các sự cố như vậy làm nổi bật sự phụ thuộc quá mức của Internet vào một vài nhà cung cấp cơ sở hạ tầng.
Ông ấy nói:
“Nhiều tổ chức vẫn để tất cả các dịch vụ quan trọng phụ thuộc vào cùng một đường dẫn, và không có một bản sao lưu thực sự hiệu quả nào. Một khi đường dẫn này gặp vấn đề, sẽ không có bất kỳ kế hoạch dự phòng nào. Đây chính là vấn đề mà chúng ta đã thấy từ trước đến nay.”
Giáo sư an ninh mạng Alan Woodward từ Đại học Surrey cho biết, sự cố vào thứ Ba lại một lần nữa cho thấy internet phụ thuộc rất nhiều vào “một số ít người chơi”. Ông mô tả Cloudflare là “công ty lớn nhất mà bạn chưa bao giờ nghe thấy”.
“Con người không còn lựa chọn nào khác ngoài việc phụ thuộc vào những công ty lớn này.”
Giám đốc công nghệ xin lỗi
Giám đốc công nghệ của Cloudflare, Dane Knecht, đã xin lỗi về sự cố này. Ông đã viết trên X:
“Khi mạng lưới Cloudflare gặp sự cố, ảnh hưởng đến lượng truy cập khổng lồ dựa vào chúng tôi, chúng tôi đã làm mất lòng khách hàng và cả toàn bộ Internet. Vấn đề này, tác động của nó và thời gian để giải quyết là không thể chấp nhận được. Chúng tôi đã bắt đầu thực hiện các biện pháp để đảm bảo rằng tình huống tương tự sẽ không xảy ra lần nữa, nhưng tôi biết rằng hôm nay thực sự đã gây rắc rối cho mọi người. Niềm tin của khách hàng là điều quan trọng nhất đối với chúng tôi, và chúng tôi sẽ nỗ lực hết sức để lấy lại niềm tin này.”
Cloudflare đã trải qua nhiều lần ngừng hoạt động tương tự trong vài năm qua.
Vào tháng 7 năm 2019, một lỗ hổng trong phần mềm Cloudflare đã dẫn đến việc một số mô-đun mạng sử dụng quá nhiều tài nguyên tính toán, khiến hàng nghìn trang web trên toàn cầu phụ thuộc vào Cloudflare (bao gồm Discord, Shopify, SoundCloud và Coinbase) ngoại tuyến trong khoảng 30 phút. Vào tháng 6 năm 2022, Cloudflare đã gặp sự cố, ảnh hưởng đến lưu lượng của 19 trung tâm dữ liệu của mình, dẫn đến việc nhiều trang web và dịch vụ lớn bị tê liệt, kéo dài khoảng một tiếng rưỡi.
Phần mềm của Cloudflare được hàng trăm ngàn công ty trên toàn cầu sử dụng, như một lớp đệm giữa trang web doanh nghiệp và người dùng cuối, nhằm bảo vệ trang web khỏi các cuộc tấn công lưu lượng hoặc sự cố do lưu lượng đột biến gây ra.
Năm ngoái, một bản cập nhật phần mềm lỗi do công ty an ninh mạng CrowdStrike phát hành đã khiến hàng triệu thiết bị chạy hệ điều hành Microsoft Windows gặp sự cố, gây ra sự hỗn loạn lớn trong nhiều ngành như hàng không, ngân hàng, y tế.
Sự cố ngừng hoạt động của CrowdStrike xuất phát từ một lỗi trong sản phẩm của họ chạy ở mức độ thấp nhất trên máy tính của khách hàng. Còn Cloudflare có vai trò bảo vệ hạ tầng Internet, như các trang web và nền tảng, vì vậy khi Cloudflare gặp sự cố, nhiều trang web phổ biến sẽ không thể truy cập hoặc gặp sự cố. Cloudflare chủ yếu chịu trách nhiệm “giữ cho các trang web luôn trực tuyến và có tốc độ đủ nhanh”, trong khi CrowdStrike tập trung vào việc bảo vệ máy tính và máy chủ khỏi các cuộc tấn công.