ギークもどきの日記帳

雑多な知識が垂れ流される場所。ほとんど無害。

Coq 8.7.1でSoftware Foundationsを読もうとしてハマったメモ

Software FoundationsのProgramming Language FoundationsのEquiv.vをProof Generalで読み込んだら以下のようなエラーが出た。

Error:
The file /Users/yuya/dev/src/local/softwarefoundations/plf/Maps.vo contains library
Top.Maps and not library Maps

以下のような内容の_CoqProjectというファイルを作成すると上手く読み込めた。

-R "." Top

Coqの物理パスと論理パスの扱いに絡む問題っぽい。

プログラミング言語をつくっている

去年の夏頃からプログラミング言語を作っています。

こんな感じのソースコードから

let
  extern print_int : Int -> Unit = "print_int"
  extern newline : Unit -> Unit = "newline"
  fun fib(n : Int) : Int =
    if n <= 1
    then 1
    else fib(n - 1) + fib(n - 2)
  fun fib_loop(n : Int) : Unit =
    let val unused:Int = fib(30)
    in if n <= 0
       then print_int(fib(0));
            newline()
       else print_int(fib(n));
            newline();
            fib_loop(n - 1)
    end
in
  fib_loop(30)
end

こんな感じのllvm irが吐かれて、

; ModuleID = 'examples/fib.mlg'


declare external ccc i8* @GC_malloc(i64)

declare external ccc {} @newline({}, i8*)

declare external ccc {} @print_int(i32, i8*)

define external ccc {} @"fib_loop.4:(Int -> {})"(i32 %n.5, i8* %captures){
; <label>:0:
  %"unused.6:Int" = call ccc i32 @"fib.2:(Int -> Int)"(i32 30, i8* undef)
  %"$k.16:Bool" = icmp sle i32 %n.5, 0
  %resultptr = alloca {}
  br i1 %"$k.16:Bool", label %then, label %else
then:
  %"$k.19:Int" = call ccc i32 @"fib.2:(Int -> Int)"(i32 0, i8* undef)
  %"$_.18:{}" = call ccc {} @print_int(i32 %"$k.19:Int", i8* undef)
  %valdec = call ccc {} @newline({} undef, i8* undef)
  store {} %valdec, {}* %resultptr
  br label %end
else:
  %"$k.23:Int" = call ccc i32 @"fib.2:(Int -> Int)"(i32 %n.5, i8* undef)
  %"$_.22:{}" = call ccc {} @print_int(i32 %"$k.23:Int", i8* undef)
  %"$_.24:{}" = call ccc {} @newline({} undef, i8* undef)
  %"$k.26:Int" = sub i32 %n.5, 1
  %valdec1 = call ccc {} @"fib_loop.4:(Int -> {})"(i32 %"$k.26:Int", i8* undef)
  store {} %valdec1, {}* %resultptr
  br label %end
end:
  %valdec2 = load {}, {}* %resultptr
  ret {} %valdec2
}

define external ccc i32 @"fib.2:(Int -> Int)"(i32 %n.3, i8* %captures){
; <label>:0:
  %"$k.7:Bool" = icmp sle i32 %n.3, 1
  %resultptr = alloca i32
  br i1 %"$k.7:Bool", label %then, label %else
then:
  store i32 1, i32* %resultptr
  br label %end
else:
  %"$k.10:Int" = sub i32 %n.3, 1
  %"$k.9:Int" = call ccc i32 @"fib.2:(Int -> Int)"(i32 %"$k.10:Int", i8* undef)
  %"$k.13:Int" = sub i32 %n.3, 2
  %"$k.12:Int" = call ccc i32 @"fib.2:(Int -> Int)"(i32 %"$k.13:Int", i8* undef)
  %valdec = add i32 %"$k.9:Int", %"$k.12:Int"
  store i32 %valdec, i32* %resultptr
  br label %end
end:
  %valdec1 = load i32, i32* %resultptr
  ret i32 %valdec1
}

define external ccc i32 @main(){
  %main = call ccc {} @"fib_loop.4:(Int -> {})"(i32 30, i8* undef)
  ret i32 0
}

llvmの最適化をかけたりなんだりゴニョゴニョすると実行可能ファイルができます。

詳しくはREADMEを読んで下さい。Githubで公開しています。

github.com

Malgoの話

Malgoはコンパイラの動作について学習するために作っている俺言語です。 文法はSMLベース(というか虎本のTigerベース)で、タプルや無名関数リテラルがあります。 言語的にはいわゆる単純型付きラムダ計算のシンプルな実装で、多相型もコレクションもまだ無いので自明でないことをするにはちょっとコツが要ります。

Haskellの話

実装にはHaskellを使いました。 選考理由は

  1. ASTとか扱うのに代数的データ型があると嬉しい
  2. 良い感じのllvmバインディングがある(https://github.com/llvm-hs/llvm-hs
  3. stackとかでてきて環境構築が楽になった
  4. 慣れてる

ぐらいです。OCamlとどっち使うか長いこと悩みましたが、これは個人的には自転車置き場の議論だったのでエイヤッで決めました。

Preludeがつらい問題

Haskellのよく知られた問題としてPreludeが辛いというか惜しいというのがあります。 例えば

  • mapの型がFunctor f => (a -> b) -> f a -> f bではなく(a -> b) -> [a] -> [b]
  • lookupのようなよくある関数がアドホック多相になっていなくてMap.lookupなどと書かないといけない
  • デフォルトの文字列型が[Char]

実用上はゴニョれば良いのであんまり問題ないですが、この問題を解決しようと色々なオレオレPrelude*1が作成されていたりします。

malgoの実装では、試しにprotolude*2を使ってみました。 これはオレオレPreludeを作るためのライブラリとして作られているようです。 malgoの実装では、protoludeをベースに、プロジェクトに依存しないユーティリティをまとめてLanguage.Malgo.Preludeモジュールを作っています。

例えば、Showのインスタンスをプリティプリンタ代わりのは微妙という話があるのでPrettyPrint型クラスを作ったり、辞書として使える型を表すDict型クラスを作ったりしています。

実装の話

処理の流れとしては

  1. パースする(Lexer.hs, Parser.y
  2. shadowingなどのアレコレを名前解決して、全識別子に連番を振る(Rename.hs
  3. 型検査を行い、識別子に型情報を付加する(TypeCheck.hs
  4. K正規化と脱糖衣を行う(KNormal.hs
  5. もろもろの最適化(まだほとんど未実装)
  6. クロージャ変換(Closure.hs
  7. LLVM IRの生成(CodeGen.hs

とかなりシンプルです。

中間表現は

  • パースでASTとして生成されるSyntax NameSyntax.hs
  • 名前解決で生成されるSyntax ID
  • 型検査で生成されるSyntax TypedID
  • K正規化&脱糖衣で生成されるHIR TypedIDHIR.hs
  • クロージャ変換で生成されるMIR TypedIDMIR.hs

みたいな感じになっています。

今後の話

  • 多相型を実装
  • リスト、配列などのコレクションを実装
  • モジュールシステムを実装

などをやっていき〜みたいな感じです。

Hakyllでブログ作った

こうののブログ - Home

stackにはHakyll用のテンプレートもあるので、ブログ制作そのものは簡単にできる。 Github Pagesの仕様にあわせるため若干のハックが必要だった。 具体的には、記事作成そのものはblogブランチで行い、_site/以下をmasterブランチにコピーしpushするということをしている。 stack exec blog deployでその辺の作業を自動化した。

CのVariable-length array

C99では, 実行時に配列の長さを指定できる機能が追加された.

#include <stdio.h>
int foo(int n) {
  int array[n];
  int array[0] = 1;
  int array[1] = 1;
  for (int i = 2; i < n; i++) {
     array[i] = array[i-1] + array[i-2];
  }
  return array[n-1];
}

sizeofは実行時に計算される.

ただし, C11ではオプション機能に格下げされている. VLAが実装されていない処理系では, __STDC_NO_VLA__というマクロが定義されている.

問題点として, メモリがアロケートされるのがスタックかヒープかが実装依存である点がある. GCCではスタックらしい. また, 巨大なVLAを定義しようとするとプログラムはクラッシュする. ある状況では非常に便利だが, 慎重に扱う必要がある.

ちょっと身内で話題になったので簡単にまとめてみた.

参考URL

詳しくはWebで!

stack ghciでllvm-hs読み込めないときにすること

$ stack ghci
Configuring GHCi with the following ...

lookupSymbol failed in relocateSection (relocate external)
/usr/local/Cellar/llvm-4.0/4.0.0/lib/llvm-4.0/lib/libLLVMLTO.a: unknown symbol `__ZN4llvm3lto11thinBackendERNS0_6ConfigEjNSt3__18functionIFNS3_10unique_ptrINS0_18NativeObjectStreamENS3_14default_deleteIS6_EEEEjEEERNS_6ModuleERNS_18ModuleSummaryIndexERKNS_9StringMapINS3_3mapIyjNS3_4lessIyEENS3_9allocatorINS3_4pairIKyjEEEEEENS_15MallocAllocatorEEERKNSH_IyPNS_18GlobalValueSummaryESJ_NSK_INSL_ISM_SV_EEEEEERNS_9MapVectorINS_9StringRefENS_13BitcodeModuleENS_8DenseMapIS12_jNS_12DenseMapInfoIS12_EENS_6detail12DenseMapPairIS12_jEEEENS3_6vectorINSL_IS12_S13_EENSK_IS1C_EEEEEE'
ghc: Could not on-demand load symbol '__ZN4llvm11raw_ostream13SetUnbufferedEv'

GHC runtime linker: fatal error: I found a duplicate definition for symbol
   __ZN4llvm11raw_ostream13SetUnbufferedEv
whilst processing object file
   /usr/local/Cellar/llvm-4.0/4.0.0/lib/llvm-4.0/lib/libLLVMLTO.a
The symbol was previously defined in
   /usr/local/Cellar/llvm-4.0/4.0.0/lib/llvm-4.0/lib/libLLVMLTO.a(LTO.cpp.o)
This could be caused by:
   * Loading two different object files which export the same symbol
   * Specifying the same object file twice on the GHCi command line
   * An incorrect `package.conf' entry, causing some object to be
     loaded twice.
ghc: Could not on-demand load symbol '__ZN4llvm9StringMapIcNS_15MallocAllocatorEE11try_emplaceIJcEEENSt3__14pairINS_17StringMapIteratorIcEEbEENS_9StringRefEDpOT_'

GHC runtime linker: fatal error: I found a duplicate definition for symbol
   __ZN4llvm9StringMapIcNS_15MallocAllocatorEE11try_emplaceIJcEEENSt3__14pairINS_17StringMapIteratorIcEEbEENS_9StringRefEDpOT_
whilst processing object file
   /usr/local/Cellar/llvm-4.0/4.0.0/lib/llvm-4.0/lib/libLLVMLTO.a
The symbol was previously defined in
   /usr/local/Cellar/llvm-4.0/4.0.0/lib/llvm-4.0/lib/libLLVMLTO.a(LTOBackend.cpp.o)
This could be caused by:

などと吐いてstack ghciが死ぬ。 intero-modeはstack ghciに依存しているのでつらい。 REPLでゴニョゴニョできないのもつらい。

解決策

stack.yamlflags: {}を次のように書き換える

flags:
  llvm-hs:
    shared-llvm: true

GHCでFizzBuzz

GHCFizzBuzzを書いた。

gen_nats(Max, Ns) :-
    true |
    gen_integers(1, Max, Ns).

gen_integers(N, Max, Is) :-
    N =< Max |
    Is = [N | Is1],
    N1 := N + 1,
    gen_integers(N1, Max, Is1).

gen_integers(N, Max, Is) :-
    N > Max |
    Is = [].

map([], Fs) :-
    true |
    Fs = [].

map([N|Ns], Fs) :-
    N mod 15 =:= 0 |
    Fs = [fizzbuzz|Fs1],
    map(Ns, Fs1).

map([N|Ns], Fs) :-
    N mod 3 =:= 0, N mod 5 =\= 0 |
    Fs = [fizz|Fs1],
    map(Ns, Fs1).

map([N|Ns], Fs) :-
    N mod 3 =\= 0, N mod 5 =:= 0 |
    Fs = [buzz|Fs1],
    map(Ns, Fs1).

map([N|Ns], Fs) :-
    N mod 3 =\= 0, N mod 5 =\= 0 |
    Fs = [N|Fs1],
    map(Ns, Fs1).

print([S|Ss], IOs) :-
    true |
    IOs = [write(S), nl | IOs1],
    print(Ss, IOs1).

print([], IOs) :-
    true |
    IOs = [].

コードの見た目はPrologに近いが、逐次性が無い、ガード節がある、などの理由でPrologで書いたものとはかなり異なる…はず。

実行はこんな感じ

?- ghc genNats(10, Ns), map(Ns, Fs), print(Fs, Os), outstream(Os).
1
2
fizz
4
buzz
fizz
7
8
fizz
buzz
Ns = [1, 2, 3, 4, 5, 6, 7, 8, 9|...],
Fs = [1, 2, fizz, 4, buzz, fizz, 7, 8, fizz|...],
Os = [write(1), nl, write(2), nl, write(fizz), nl, write(4), nl, write(...)|...].

GHCつながりでHaskell版も書いてみた。GHC版と似せるためにちょっと変な書き方をしている。

module Main where

genNats :: Int -> [Int]
genNats m = genIntegers 1 m

genIntegers :: Int -> Int -> [Int]
genIntegers n m | n <= m = n : genIntegers (n + 1) m
                | otherwise  = []

map' :: [Int] -> [String]
map' [] = []
map' (n:ns) | n `mod` 15 == 0 = "fizzbuzz" : map' ns
            | n `mod` 3 == 0  = "fizz" : map' ns
            | n `mod` 5 == 0  = "buzz" : map' ns
            | otherwise       = show n : map' ns

main :: IO ()
main = mapM_ putStrLn (map' (genNats 10))

実行するとこんな感じ

1
2
fizz
4
buzz
fizz
7
8
fizz
buzz

GHCのコードはHaskellに似ている(これが言いたかっただけ)。

GHC(Guarded Horn Clauses)のインストール

GHCとは

https://ja.wikipedia.org/wiki/Guarded_Horn_Clauses/

インストール方法

今回は、SWI-Prolog上に実装されたGHCの処理系をインストールする。

SWI-PrologSWI-Prolog からインストールできる。

次に、 Software from UEDA Lab. から GHC system running on top of SWI-Prolog をダウンロード、展開する。

展開したディレクトリに移動し、

$ swipl
Welcome to ~...

?- ['ghcswi.pl'].
Warning ~...
true.

?- 

これでGHCプログラムを実行できる様になった。

GHCプログラムのコンパイルghccompile/1で行う

?- ghccompile('fib.ghc').
go/1', 'fibonacci/2', 'fib/4', 'outterms/2', ''END.'
true.

実行は

?- ghc go(10).
1
1
2
3
5
8
false.

fib.ghcはこんな感じ

go(Max) :- true |
           fibonacci(Max, Fs),
           outterms(Fs, Os), outstream(Os).

fibonacci(Max, Ns) :- true |
                      fib(Max, 0, 1, Ns).

fib(Max, N1, N2, Ns0) :- N2 =< Max |
                         Ns0 = [N2 | Ns1],
                         N3 := N1 + N2, fib(Max, N2, N3, Ns1).

fib(Max, N1, N2, Ns0) :- N2 > Max |
                         Ns0 = 0.

outterms([X|Xs1], Os0) :- true |
                          Os0 = [write(X), nl | Os1],
                          outterms(Xs1, Os1).

outterms([],      Os0) :- true |
                          Os0 = [].