Visar inlägg med etikett FRA - Teknik. Visa alla inlägg
Visar inlägg med etikett FRA - Teknik. Visa alla inlägg

tisdag, september 20, 2011

Utländska företag och libyisk internetövervakning

Wall Street Journal har en intressant artikel om företag som byggt upp libyisk internetövervakning. Boeings dotterföretag Narus dyker ofta upp, även i detta fall. Får lägga till franska Amesys, kinesiska ZTE och sydafrikanska VASTech till listan. Amesys verkar ha en produkt som kallas "Eagle". I artikeln står följande.

Whereas many Internet interception systems carry out basic filtering on IP address and extract only those communications from the global flow (Lawful Interception), EAGLE Interception system analyses and stores all the communications from the monitored link (Massive interception).

On its website, Amesys says its "strategic nationwide interception" system can detect email from Hotmail, Yahoo and Gmail and see chat conversations on MSN instant messaging and AIM. It says investigators can "request the entire database" of Internet traffic "in real time" by entering keywords, email addresses or the names of file attachments as search queries.
Av artikeln framgår det att VASTech tjänst "Zebra" kan användas för trafikanalys, dvs kartläggning av individer, nätverk, grupper och organisationer.

A description of the company's Zebra brand surveillance product, prepared for a trade show, says it "captures and stores massive volumes of traffic" and offers filters that agents can use to "access specific communications of interest from mountains of data." Zebra also features "link analysis," the description says, a tool to help agents identify relationships between individuals based on analysis of their calling patterns.

lördag, februari 13, 2010

Some thoughts about cryptanalysis

Later this year I will have text published in the Nordic Yearbook on Law Informatics (Nordisk Årsbok i Rättsinformatik): "A Paradigm Shift in Electronic Surveillance Law".

I wrote a section about cryptanalysis but later came to the conclusion that the section should be excluded. Considering that the work is done I do not want it to be vasted. After participating in a discussion on Rick Falkvinge's blog which, inter alia, concerned cryptanalysis I decided to publish the section here. It is written for a law journal which explains why it is quite rudimentary. The purpose of this section was to explain why law enforcement and intelligence agencies focus more on traffic analysis and less on content analysis. My explanation is that there is a tendency that with increasing processing power of computers the efficiency between encryption and attacking a crypto (cryptanalysis) is growing, to the detriment of the later. Thus, traffic analysis is becoming more important.

All comments are welcome. Please have some understanding that I am lawyer and not a mathematician.

Encryption and Cryptanalysis
With increasing processing power of computers the efficiency between encryption and attacking a crypto (cryptanalysis) is growing, to the detriment of the later.1) I will use the example of the RSA algorithm to explain why there is such a tendency. The RSA is an algorithm used for public-key cryptography and it was invented by Ronald L. Rivest, Adi Shamir, and Leonard Adleman in 1977, the letters RSA are the initials of their surnames. The RSA cryptosystem is based on the use of prime numbers and factoring.2)

Prime numbers are numbers that are not evenly divisible by any smaller number, except 1, for example 2, 3, 5, 7, 11, and 13. A non-prime, or composite number, is the product of smaller primes, known as its prime factors. 391, for example is the product of the primes 17 and 23. A number is factored when all of its prime factors are identified. As the size of the composite number increases, the difficulty of factoring and cryptanalysis increases rapidly.3) I will explain why.

RSA involves a public key for encryption and a private key for decryption. The private key corresponds to the public key, because both are based on the same modulus, n, which in turn is based on prime numbers.4) In the example above n is 391. One method of cryptanalysis is for attacker to discover the private key corresponding to a given public key. This is done by factoring the public modulus, n, into its prime factors, in the example above 17 and 23. From the prime factors and the public key exponent e, the attacker can easily get the private key exponent d. The difficulty lies in factoring n. The encryptor can use larger prime factors increasing the difficulty to factor.5) As indicated above, increasing processing power of computers allows the use of larger prime factors which will increase the difference in efficiency between encryption and cryptanalysis, to the detriment of the later.

The resources needed to add a digit when encrypting is linear while the resources needed to attack such a crypto a crypto is exponential. See the chart below.6)

I will attempt to explain this through the use of practical example. Assume that you have four digit entry code to your house with the numbers 0-9. This will generate 10 000 combinations (10*10*10*10). It will take you seconds to enter the code. For an intruder it would probably take several hours if he or she randomly enters different combinations. However, if somebody constructs a robot that can enter 1 000 combinations in a minute, you will have a problem because the code will be broken within ten minutes. This can be solved by adding a fifth digit, generating 100 000 combinations (10*10*10*10*10). It would take you a mere extra second to enter the code, while it could require the robot to work more than an extra hour. The same logics apply to cryptos using large prime factors generating a private key with many digits.

However, there is a danger that an attacker in the future may use faster machines and better factoring algorithms than are currently available, which may be used to attack RSA cryptosystem keys generated in the past.7) Moreover, I am making a general observation which does not exclude the possibility that specific encryption techniques already may be subject to successful attacks that use currently available technology and algorithms.

It is easy to factor 100-digit numbers with today's hardware and algorithms. There is no public information which indicates that numbers of more than 200 digits have been successfully factored. For example, RSA modulus RSA-2048, has a length of 2048 bits (617 decimal digits). RSA laboratories expect RSA-2048 to stand for decades, assuming that there will be no fundamental algorithmic or computing advances.8) Such advances may include the discovery of a new factoring method which factoring researchers consider has a remote possibility, or the development of a quantum computer which involves significant practical difficulties.9)

1) FRA, 14 March 2007, Sveriges Television (Publ.), Frågor & svar, (16 November 2008), Question & Answer 5; Klamberg, Mark, Nilsson, Mikael, Petersson, Anna, Seipel, Peter, Flyghed, Janne, Magnusson Sjöberg, Cecilia, Karlgren, Jussi, Bylund, Markus, Palmås, Karl, Ström, Pär, Thorburn, Daniel & Westerholm, Johan, FRA-lagen medför massiv kartläggning av oskyldiga Dagens Nyheter, 3 September 2008

2) RSA Laboratories (Publ.), RSA Algorithm, "http://www.rsa.com/rsalabs/node.asp?id=2146", (27 November 2008)

3) RSA Laboratories (Publ.), The RSA Factoring Challenge FAQ, "http://www.rsa.com/rsalabs/node.asp?id=2094#HowWereTheNumbersGenerated", (27 November 2008)

4) RSA Laboratories (Publ.), Crypto FAQ, "http://www.rsa.com/rsalabs/node.asp?id=2152", (27 November 2008), section 3.1.1 What is the RSA cryptosystem?

5) ibid, section 3.1.3 What would it take to break the RSA cryptosystem?; section 2.3.3 What is the factoring problem?

6) I have made the following assumptions concerning the relation between resources (y) and digits used (x) with k as the potential combinations for a digit. In the example with the entry code to the house there is 10 potential combinations (0-9). This generates the following to functions. Resources to encrypt (y1)=x*10; resources to attack (y2)=e x

7) ibid, section 2.3.5 What improvements are likely in factoring capability?

8) The RSA Factoring Challenge FAQ

9) Crypto FAQ, section 2.3.3 What is the factoring problem?; section 2.3.5 What improvements are likely in factoring capability?; section 2.4.3 What is exhaustive key search?; section 7.17 What is quantum computing?

måndag, november 17, 2008

En teknisk fråga

Jag läste ett inlägg av Josef och följande fråga uppstod då jag håller på att skriva en text som ska publiceras i akademiska sammanhang. Vad är förhållandet mellan metadata och trafikdata? Jag uppfattar att trafikdata är en form av metadata, där det senare är ett mer omfattande begrepp. Stämmer det? Finns det något tekniskt lexikon, lärobok i datalogi eller annat verk där jag kan hitta detta definierat? Jag kan inte hänvisa till wikipedia i dessa sammanhang.

måndag, september 01, 2008

Möte mellan juridik och teknik

Jag vill i detta inlägg diskutera mötet mellan juridik och teknik.

1. Bakgrund för den som ej är teknolog
En stor oklarhet i debatten har skapats genom att FRA-företrädare ständigt talar i liknelser utan att förklara hur den relevanta informationen ska väljas ut. Exempel på liknelser är att telekommunikation är som ett vattenfall och FRA använder en sked för att välja ut den relevanta informationen. Vi vet ju alla att det inte finns vattenfall och skedar i en fiberoptisk kabel. Vi vet också att om digital information ska sorteras så måste en dator vara inblandad. Därför måste all information databehandlas innan man vet vad som är relevant. Om man inte sorterar i en dator så måste man närmast ha en ”magisk hatt” för att på avstånd avgöra om information är relevant och ska hämtas in. Sådana ”magiska hattar” finns naturligtvis inte.

Andra förvirrande liknelser är knarkhundar som sniffar på kommunikationen och poliser med en fartradar. Har en knarkhund eller en polis någonsin fått plats i en fiberoptisk kabel? Syftet med att använda liknelser är att förvirra och inte upplysa oss.

En tankefel som jag har gjort tidigare är att jag trott att FRA sorterar på grundval av text. Detta är omöjligt, bl.a. eftersom en stor del av trafiken är krypterad. FRA-företrädare brukar alltid säga att de inte söker på text och att de klarar sitt arbete även om kommunikationen är krypterad. Därför har många med mig inte kunnat förstå hur FRA arbetar. Svaret är sociogram som bygger på relationer vilket endast kräver trafikdata (avsändare, mottagare, tid) och inte nödvändigtvis innehållsdata (texten) i trafiken. På detta sätt kan man hantera krypterad trafik.

2. Terminologi
Vi måste först ha en gemensam terminologi. Jag har tagit den från Tomas Mattsson, kommentator på denna blogg. Om terminologin behöver justeras, kan vi diskutera det också.

2.1 Sociogram
Sociogram bygger på parvisa identiteter, par över mejl-från och mejl-till, telefonnummer-från och telefonnummer-till och sms-nummer-från och sms-nummer-till.

2.2 Sökbegrepp
FRA-filtret definieras som en uppgiftssamling och dess sökbegrepp består av tekniska parametrar och personuppgifter, t.ex. namn. Personuppgifter som avslöjar ras eller etniskt ursprung, politiska åsikter, religiös eller filosofisk övertygelse, medlemskap i fackförening eller som rör hälsa eller sexualliv får också användas som sökbegrepp. Med tekniska parametrar avses såväl manuella som automatiska frekvenser, e-postadresser och telefonnummer. (Tidigare inlägg här)

2.4 Representation av kontakthändelse
För att representera en kontakthändelse via mejl i en relationsdatabas och samtidigt ta hänsyn till tidpunkten krävs ett primärnyckelschema

2.5 Primärnyckelschema
En primärnyckel är unik, motsvaras av t.ex. ett personnummer: id1, id2, tidsstämpel
2.5.1 id1 = mejladress-från
2.5.2 id2 = mejladress-till
2.5.3 tidsstämpel = datum + klockslag

Det måste alltså finnas ett primärnyckelschema för sociogrammet och en rådatamängd som är strukturerad enligt detta primärnyckelschema. Rådatamängden kan naturligtvis representeras på olika sätt, men inte på så väldigt många olika sätt eftersom det för sociogrammet grundläggande parvisa förhållandet är givet.

2.6 All data överförs
I 6 kap. 19 a § lagen (2003:389) om elektronisk kommunikation står det ”operatörer som äger tråd i vilka signaler förs över Sveriges gräns [är] skyldiga att överföra dessa till samverkanspunkter”

Prop. 2006/07:63, sid. 83: ”De trådägande operatörerna skall till särskilda samverkanspunkter överföra all trafik som förs över Sveriges gräns."

2.7 Hur skall signalerna tas om hand?
Prop. 2006/07:63, sid. 85: "Hur skall signalerna enkelt kunna tas om hand? Utöver vad som gäller för operatörer som äger tråd föreslås alla operatörer som för signaler över landets gräns vara skyldiga att se till att signalerna enkelt kan tas om hand av myndigheten (Försvarets radioanstalt), vilket sker efter begäran från myndigheten. Med operatör avses den som innehar eller på annat sätt råder över ett allmänt kommunikationsnät eller tillhörande installation (se 1 kap. 7 § LEK). Detta gäller således trådägare, Internet Service Providers (ISP) m.fl.

För att en ändamålsenlig signalspaning skall kunna ske måste signaler i elektronisk form enkelt kunna tas om hand av myndigheten, vilket bl.a. betyder att datareduktion behöver genomföras. Detta innebär att huvuddelen av de levererade signalerna sållas bort. För att myndigheten skall kunna göra detta behövs vissa ingångsvärden från operatörerna, dvs. även från sådana operatörer som inte äger tråd. Dessa ingångsvärden kan exempelvis bestå av förbindelsernas benämning, arkitektur, bandbredd, riktning, typ av signalering, vilka som hyr förbindelser av operatören m.m., dock inte detaljuppgifter om speciella skydd för konfidentialitet som operatörerna exklusivt tillhandahåller slutkunder. Uppgifterna behövs också för myndighetens vidare förädling av informationen."

Jag har uppfattat från tekniker att ovanstående text hör samman med OSI-modellen som gör att FRA kan hantera krypterad information. Stämmer det? Kan någon förklara?

OSI-modellen

2.8 Yttre hot
Yttre hot definieras som internationell terrorism, annan stats agerande mot Sverige, IT-beroende, försörjningskriser, ekologiska obalanser, miljöhot, etniska eller religiösa konflikter, stora flykting- och migrationsrörelser samt ekonomiska utmaningar i form av valuta- och räntespekulationer. (Prop. 2006/07:63, sidan 17 och 36)

2.9 Min teori
Frågan är följande "hur stor del av populationen måste kartläggas med sociogram?"

Min teori:
1. Börjar man från noll måste man kartlägga bredare. Har man basdata från vanlig spaning eller fria antaganden kan man kartlägga smalare.
2. Arbetar man med få yttre hot kan man kartlägga smalare. Arbetar man med många yttre hot måste man kartlägga bredare, i princip hela populationen. Finns det en matematisk modell som kan ge svaret på detta?