Pergi ke kandungan

Insiden CrowdStrike 2024

Daripada Wikipedia, ensiklopedia bebas.
Insiden CrowdStrike 2024
Beberapa skrin biru kematian disebabkan oleh kemas kini perisian yang rosak pada tali sawat bagasi lapangan terbang di Lapangan Terbang LaGuardia, New York City
Tarikh19 Julai 2024; 10 bulan yang lalu (2024-07-19)
LokasiSeluruh dunia
Juga dikenali sebagai
Y2K24, Pandemik-Digital 2024
JenisGangguan IT
PenyebabKehilangan komputer disebabkan oleh kemas kini fail konfigurasi CrowdStrike yang rosak
MotifKemas kini perisian keselamatan siber yang salah (bukan serangan siber)
HasilKehilangan tidak sengaja ~8.5 juta sistem operasi Microsoft Windows di seluruh dunia menyebabkan gangguan global perkhidmatan kritikal dalam gangguan terbesar dalam sejarah teknologi maklumat

Pada 19 Julai 2024, syarikat keselamatan siber Amerika Syarikat CrowdStrike mengedarkan kemas kini perisian keselamatan yang rosak yang menyebabkan dianggarkan 8.5 juta komputer yang menjalankan Microsoft Windows mengalami kehilangan dan tidak dapat memulakan semula dengan betul.[1] Ini menyebabkan apa yang dianggap sebagai gangguan terbesar dalam sejarah teknologi maklumat[2] dan "bersejarah dari segi skala".[3]

Gangguan ini mengganggu kehidupan sehari-hari, perniagaan, dan kerajaan di seluruh dunia. Industri yang terjejas termasuk syarikat penerbangan, lapangan terbang, bank, hotel, hospital, pengilangan, pasaran saham, penyiaran, stesen minyak, titik jualan (POS) untuk kedai, dan lain-lain. Perkhidmatan kerajaan, seperti perkhidmatan kecemasan dan laman web, juga terjejas dengan teruk.[4][5] Kerosakan kewangan di seluruh dunia dianggarkan sekitar US$10 bilion.[6][7]

Dalam masa beberapa jam, ralat itu ditemui dan satu penyelesaian dikeluarkan,[8] tetapi kerana banyak komputer yang terjejas perlu dibaiki secara manual,[9] gangguan berterusan pada banyak perkhidmatan.[10][11]

Latar Belakang

[sunting | sunting sumber]

CrowdStrike menghasilkan rangkaian produk perisian keselamatan untuk perniagaan, yang direka untuk melindungi komputer daripada serangan siber. Produk Falcon Sensor, pemindai kebolehan CrowdStrike, memasang sensor titik akhir pada tahap kernel sistem pengendalian di komputer individu untuk mengesan dan mencegah ancaman.[12] Patch diedarkan secara rutin oleh CrowdStrike kepada pelanggannya untuk membolehkan komputer mereka menangani ancaman baru.[13]

Syarikat ini diketuai oleh CEO George Kurtz, yang pada tahun 2010 merupakan ketua pegawai teknologi di McAfee[14] apabila syarikat perisian keselamatan itu melancarkan kemas kini perisian yang memadamkan fail sistem Windows XP yang kritikal dan menyebabkan sistem yang terjejas mengalami skrin biru dan memasuki gelung but.[15]

Kerosakan

[sunting | sunting sumber]

Pada 19 Julai jam 04:09 UTC, CrowdStrike mengedarkan kemas kini konfigurasi untuk perisian pemacu Falcon mereka bagi PC Windows dan pelayan. Kemas kini tersebut menyebabkan mesin mengalami gelung but atau mod pemulihan.[16][17]

Hampir serta-merta, mesin maya Windows di platform awan Microsoft Azure mula reboot dan mengalami kerosakan.[18] Pada jam 06:48 UTC, Google Compute Engine juga melaporkan masalah tersebut. Masalah ini hanya mempengaruhi komputer dan pelayan Windows tertentu yang menggunakan perisian CrowdStrike Falcon.[19] Masalah ini terutama mempengaruhi sistem yang menjalankan Windows 10 dan Windows 11,[16] tetapi sistem yang menjalankan Windows 7 dan Windows 8 juga terjejas.[20]Templat:Primary source inline[tiada dalam ayat yang diberikan] Komputer yang menjalankan macOS dan Linux tidak terjejas oleh masalah ini, begitu juga dengan kebanyakan PC Windows peribadi.[19] Pada tahun yang sama, masalah serupa juga mempengaruhi RedHat Linux dan disyaki mempengaruhi pengedaran Debian Linux.[21]

CrowdStrike membatalkan kemas kini kandungan pada jam 05:27 UTC,[22] dan peranti yang dimulakan semula selepas pembatalan tidak terjejas.[23]

Pada jam 07:15 UTC, Google mengatakan bahawa kemas kini CrowdStrike adalah penyebabnya.[24] Dalam beberapa jam, CEO CrowdStrike George Kurtz mengesahkan bahawa kemas kini fail konfigurasi kernel yang cacat dari CrowdStrike telah menyebabkan masalah tersebut.[9][8] Pada jam 09:45 UTC, Kurtz mengesahkan bahawa pembaikan telah dilaksanakan.[25][26] Kurtz dalam satu posting di X mengesahkan bahawa masalah tersebut bukan disebabkan oleh cyberattack atau berkaitan dengan cyberattack.[9][27]

Sehari sebelum kemas kini yang cacat, platform Azure mengalami kerosakan yang menghalang akses beberapa syarikat kepada penyimpanan mereka dan aplikasi Microsoft 365 di wilayah Tengah Amerika Syarikat di Azure.[28] Microsoft menyatakan bahawa insiden 18 Julai tidak berkaitan dengan masalah CrowdStrike, tetapi kedua-dua insiden tersebut menambah masalah bagi pelanggan-pelanggan ini.[29]

Kemas kini kepada fail konfigurasi yang bertanggungjawab untuk menyaring saluran bernama, Channel File 291, menyebabkan logic error dengan klien sensor Windows,[27] menyebabkan mesin yang terjejas memasuki blue screen of death dengan kod hentian PAGE_FAULT_IN_NONPAGED_AREA, yang menunjukkan kesalahan yang disebabkan oleh page fault.[22][23][30]

Masalah ini diperburuk pada peranti dengan penyulitan cakera BitLocker Windows yang diaktifkan, kerana syarikat sering melakukannya untuk meningkatkan keselamatan, kerana memperbaiki masalah tersebut mungkin memerlukan kunci pemulihan yang disimpan di pelayan yang itu sendiri telah terhempas.[31][32]

Para pakar mengesyaki bahawa kemas kini tersebut tidak melalui prosedur patch management rutin (mengujinya dalam sandbox) untuk memastikan tiada isu.[33]

Mesin yang terjejas boleh dipulihkan dengan memulakan semula dalam safe mode atau Windows Recovery Environment dan memadamkan sebarang fail .sys yang bermula dengan C-00000291- dan dengan cap masa 0409 UTC dalam direktori %windir%\System32\drivers\CrowdStrike\.[34] Oleh kerana proses ini perlu dilakukan secara tempatan pada setiap mesin individu, ia "dijangka mengambil masa beberapa hari" untuk perniagaan yang terjejas memulihkan semua sistem.[35] Selain itu, kakitangan teknikal perlu memulakan semula komputer yang terjejas secara individu dengan campur tangan manual pada setiap sistem, yang mungkin merupakan "tugas yang besar".[36][37]

Beberapa pelanggan Microsoft Azure mendapati bahawa mereka boleh memperbaiki masalah tersebut dengan memulakan semula mesin maya yang terjejas sehingga 15 kali, idealnya sambil disambungkan ke Ethernet.[38][22] Microsoft juga mengesyorkan memulihkan sandaran dari sebelum 18 Julai untuk membetulkan isu tersebut.[39]

Langkah-langkah Jangka Panjang

[sunting | sunting sumber]

Gangguan ini menimbulkan persoalan tentang oligopoli dan sentralisasi dalam sektor teknologi maklumat.[40][41] Majoriti komputer di seluruh dunia menggunakan Microsoft Windows, mencipta sebuah monoculture yang mengurangkan daya ketahanan.[42][41] Ciaran Martin berkata, "Ini adalah gambaran yang sangat, sangat tidak selesa tentang kerapuhan infrastruktur internet teras dunia".[42] Pakar infrastruktur kritikal Gregory Falco mengulas, "Penyedia keselamatan siber adalah sebahagian daripada tulang belakang homogen sistem moden dan sangat penting dalam cara kita beroperasi sehingga kesilapan dalam operasi mereka akan mempunyai kesan yang serupa dengan kegagalan dalam sistem yang dikenali umum".[43] Pakar keselamatan menyarankan lebih banyak redundansi, untuk mengelakkan single points of failure,[40] penggunaan lebih luas sistem federated yang terdesentralisasi dan heterogen,[41] serta kemarahan awam terhadap kegagalan pemimpin politik untuk mengatur kepelbagaian dan persaingan.[42] Penguatkuasaan pendedahan pelanggaran dan kerentanan juga telah dicadangkan.[44] Dalam temubual dengan Wired, perunding keselamatan siber Jake Williams berkata bahawa gangguan ini telah "menunjukkan mengapa kemas kini tanpa campur tangan IT tidak berdaya tahan," dan bahawa "orang mungkin kini menuntut perubahan dalam model operasi ini."[45]

  1. ^ Weston, David. "Helping our customers through the CrowdStrike outage". Microsoft. Dicapai pada 20 July 2024.
  2. ^ Milmo, Dan; Kollewe, Julia; Quinn, Ben; Taylor, Josh; Ibrahim, Mimi (19 July 2024). "'Largest IT outage in history' hits Microsoft Windows and causes global chaos". The Guardian. Dicapai pada 19 July 2024.
  3. ^ Sorkin, Andrew Ross; Mattu, Ravi; Warner, Bernhard; Kessler, Sarah; Merced, Michael J. de la; Hirsch, Lauren; Livni, Ephrat; Gaffney, Austyn (2024-07-19). "Counting the Costs of a Global IT Outage". The New York Times (dalam bahasa Inggeris). ISSN 0362-4331. Dicapai pada 2024-07-20.
  4. ^ Godfrey, Paul; Druker, Simon; Wynder, Ehren (19 July 2024). "911 call centers back online after IT outage causes global chaos". United Press International (dalam bahasa Inggeris). Dicapai pada 19 July 2024.
  5. ^ "Live: 'Completely unprecedented' outage causes havoc with IT systems across globe". ABC News (dalam bahasa Inggeris). 19 July 2024. Dicapai pada 19 July 2024.
  6. ^ "Companies ready insurance claims over CrowdStrike outage". Business Insider.
  7. ^ "CrowdStrike outage cost economy 'tens of billions of dollars', firms want it back". South China Morning Post. July 22, 2024.
  8. ^ a b "In 1st Statement After Outage, CrowdStrike CEO Says..." NDTV.com. Dicapai pada 19 July 2024.
  9. ^ a b c Browne, Ryan (19 July 2024). "How a software update caused one of the world's biggest IT blackouts". CNBC (dalam bahasa Inggeris). Dicapai pada 19 July 2024.
  10. ^ Fung, Brian (19 July 2024). "Recovering from the global tech outage could be a long, arduous process". CNN (dalam bahasa Inggeris). Dicapai pada 20 July 2024.
  11. ^ "Microsoft IT outage live: Total recovery from CloudStrike failure 'could take weeks' amid more flight delays". Yahoo News (dalam bahasa Inggeris). 20 July 2024. Dicapai pada 20 July 2024.
  12. ^ Warren, Tom (19 July 2024). "Major Windows BSOD Issue Hits Banks, Airlines, and TV Broadcasters". The Verge (dalam bahasa Inggeris). Dicapai pada 20 July 2024.
  13. ^ Sharwood, Simon (19 July 2024). "CrowdStrike File Update Bricks Windows Machines Around the World: Falcon Sensor Putting Hosts into Deathloop – But There's a Workaround". The Register. Dicapai pada 19 July 2024.
  14. ^ Finkle, Jim (2011-10-18). "McAfee loses high-profile researcher and CTO". Reuters (dalam bahasa Inggeris). Dicapai pada 2024-07-22.
  15. ^ Ed Bott (21 April 2010). "Defective McAfee update causes worldwide meltdown of XP PCs". ZDNet. Dicapai pada 21 July 2024.
  16. ^ a b Baran, Guru (19 July 2024). "CrowdStrike Update Pushing Windows Machines Into a BSOD Loop". Cyber Security News (dalam bahasa Inggeris). Dicapai pada 19 July 2024.
  17. ^ "United, Delta and American Airlines issue global ground stop on all flights". ABC News (dalam bahasa Inggeris). Dicapai pada 19 July 2024.
  18. ^ "Azure status". azure.status.microsoft. Dicapai pada 19 July 2024.
  19. ^ a b Capell, James (19 July 2024). "Servers down after CrowdStrike update — How it happened and how to fix". TechRadar (dalam bahasa Inggeris). Dicapai pada 19 July 2024.
  20. ^ "Technical Details on 19 July 2024 Outage | CrowdStrike". crowdstrike.com. 20 July 2024.
  21. ^ Sharwood, Simon (21 Jul 2024). "CrowdStrike's Falcon Sensor also linked to Linux kernel panics and crashes". Dicapai pada 2024-07-22.
  22. ^ a b c "Statement on Falcon Content Update for Windows Hosts". crowdstrike.com (dalam bahasa Inggeris). Dicapai pada 19 July 2024.
  23. ^ a b "CrowdStrike Falcon blue screen issue updates". www.eye.security (dalam bahasa Inggeris). Dicapai pada 19 July 2024.
  24. ^ "Google Cloud Service Health". status.cloud.google.com. Dicapai pada 19 July 2024.
  25. ^ Kurtz, George [@George_Kurtz] (19 July 2024). "CrowdStrike is actively working with customers impacted by a defect found in a single content update for Windows hosts. Mac and Linux hosts are not impacted. This is not a security incident or cyberattack. The issue has been identified, isolated and a fix has been deployed. We refer customers to the support portal for the latest updates and will continue to provide complete and continuous updates on our website. We further recommend organizations ensure they're communicating with CrowdStrike representatives through official channels. Our team is fully mobilized to ensure the security and stability of CrowdStrike customers" (Twit). Dicapai pada 19 July 2024 – melalui Twitter.
  26. ^ "Microsoft IT outage latest: Security firm Crowdstrike finds cause of global IT 'disaster' – as cyber attack ruled out". Sky News (dalam bahasa Inggeris). Dicapai pada 19 July 2024.
  27. ^ a b CrowdStrike (20 July 2024). "Technical Details on 19 July 2024 Outage | CrowdStrike". crowdstrike.com (dalam bahasa Inggeris). Dicapai pada 20 July 2024.
  28. ^ "Microsoft says its cloud services are back up after major outage". TechRadar. 19 July 2024.
  29. ^ "What Caused Such a Widespread Tech Meltdown?". The New York Times. 19 July 2024. Dicapai pada 19 July 2024.
  30. ^ "Botched security update breaks Windows worldwide, causing BSOD and crashes". Neowin (dalam bahasa Inggeris). 19 July 2024. Dicapai pada 19 July 2024.
  31. ^ Speed, Richard (19 July 2024). "Angry Admins Share the CrowdStrike Outage Experience". The Register. Dicapai pada 19 July 2024.
  32. ^ "Statement on Falcon Content Update for Windows Hosts". CrowdStrike.com (dalam bahasa Inggeris). Dicapai pada 20 July 2024.
  33. ^ Zeba Siddiqui (20 July 2024). "CrowdStrike update that caused global outage likely skipped checks, experts say". Reuters. Dicapai pada 21 July 2024.
  34. ^ "Technical Details on 19 July 2024 Outage | CrowdStrike". CrowdStrike Blog (dalam bahasa Inggeris). CrowdStrike. 20 July 2024. Dicapai pada 20 July 2024.
  35. ^ Bishop, Katrina; Kharpal, Arjun (19 July 2024). "CrowdStrike Issue Causes Major Outage Affecting Businesses Around the World". CNBC. Dicapai pada 19 July 2024.
  36. ^ Tidy, J. (19 July 2024). "Crowdstrike Says IT Problems Will Take Time to Fix". BBC. Dicapai pada 20 July 2024. Technical staff will need to go and reboot each and every computer affected, which could be a monumental task.
  37. ^ O'Flaherty, K. (19 July 2024). "CrowdStrike Windows Outage—What Happened and What to Do Next". Forbes Media. Dicapai pada 20 July 2024. It's going to need manual intervention on each system.
  38. ^ Warren, Tom (19 July 2024). "Microsoft on CrowdStrike Outage: Have You Tried Turning It Off and On? (15 Times)". The Verge. Dicapai pada 20 July 2024.
  39. ^ Cunningham, Andrew (2024-07-19). "CrowdStrike fixes start at "reboot up to 15 times" and get more complex from there". Ars Technica (dalam bahasa Inggeris). Dicapai pada 2024-07-21.
  40. ^ a b "Serious questions to answer after what could be the biggest IT outage in history". Sky News (dalam bahasa Inggeris).
  41. ^ a b c "Major Microsoft outage: Numerous sectors hit in worldwide "Digital Pandemic"". 19 July 2024. Dicapai pada 21 July 2024.
  42. ^ a b c "Cyber outage disrupts global services, crashes Windows PCs". CBC. 19 July 2024. Dicapai pada 19 July 2024.
  43. ^ "What experts are saying about the massive CrowdStrike global tech outage". Quartz (dalam bahasa Inggeris). 2024-07-19. Dicapai pada 2024-07-21.
  44. ^ "Lesson from global Microsoft outage: Need for greater regulation and accountability". The Indian Express (dalam bahasa Inggeris). 20 July 2024.
  45. ^ Newman, Lily Hay. "How One Bad CrowdStrike Update Crashed the World's Computers". Wired.